RandomForest 모델은 데이터의 각 특징이 범주형(categorical)인지 연속형(numerical)인지 직접적으로 인식하지 않습니다. 대신 데이터 과학자가 명시적으로 범주형 변수와 연속형 변수를 구분하여 적절한 전처리를 수행해야 합니다.범주형 변수 인식 및 전처리 방법데이터 타입을 통해 인식:Pandas에서 object, category 타입을 가진 열은 일반적으로 범주형 변수로 간주됩니다.유일 값의 개수를 통해 인식:열에 포함된 고유 값의 개수가 상대적으로 적으면 범주형 변수로 간주할 수 있습니다.명시적으로 지정:데이터 과학자가 도메인 지식을 바탕으로 범주형 변수를 명시적으로 지정합니다.예제 코드: 범주형 변수 인식 및 원-핫 인코딩다음은 Pandas를 사용하여 범주형 변수를 인식하고, 이를..
물론입니다! 서울특별시 각 구별로 주요 동들을 따옴표와 콤마로 나열해 보겠습니다. 이 목록은 각 구별 대표적인 동들을 포함하고 있으며, 모든 동을 포함하지는 않습니다.강남구'개포동', '논현동', '대치동', '도곡동', '삼성동', '세곡동', '수서동', '신사동', '압구정동', '역삼동', '일원동', '청담동'강동구'강일동', '고덕동', '길동', '둔촌동', '명일동', '상일동', '성내동', '암사동', '천호동'강북구'미아동', '번동', '수유동', '우이동'강서구'가양동', '공항동', '등촌동', '방화동', '염창동', '화곡동'관악구'남현동', '봉천동', '신림동'광진구'군자동', '구의동', '자양동', '중곡동'구로구'고척동', '구로동', '신도림동', '오류동', '천..
# utilsimport pandas as pdimport numpy as npfrom tqdm import tqdmimport pickleimport warnings;warnings.filterwarnings('ignore')# Modelfrom sklearn.preprocessing import LabelEncoderfrom sklearn.model_selection import train_test_splitfrom sklearn.metrics import mean_squared_errorfrom sklearn.ensemble import RandomForestRegressorfrom sklearn import metrics#import eli5#from eli5.sklearn import Permu..
데이터셋을 이미 병합한 후에 NaN 값들을 다른 데이터셋으로부터의 정보로 업데이트하고자 할 때, 주로 update() 메서드를 사용하거나 다시 merge()를 통해 조건에 따라 필요한 값을 채워 넣을 수 있습니다. 이러한 방식은 주로 추가 정보를 통해 누락된 데이터를 채우거나 기존의 정보를 최신화할 때 사용됩니다.방법 1: update() 메서드 사용하기update() 메서드는 원본 DataFrame의 누락된 값(NaN)을 다른 DataFrame에서 가져온 값으로 채워 넣습니다. 이 방법은 인덱스와 컬럼 레이블을 기반으로 값을 업데이트합니다.import pandas as pd# 예시 데이터 프레임 생성df_main = pd.DataFrame({ 'A': [1, 2, 3], 'B': [400, ..
4월부터 시작이었나. 벌써 7월. 반 정도 지나갔다.일단 수확은1. 파이썬에 능숙해졌다.프로젝트를 하면서 파이썬으로 데이터는 자유자재로 다룰 수 있다. with ChatGPT2. VSCODE 환경셋팅에 익숙해졌다.venv, remote, git을 익혔다.3. ML 에 대해 어느 정도 사이클을 익혔다.개별 모델과 평가지표에 대해 설명하라고 하면 할 수 없지만 프로젝트에서 어떤 순서로 어떤 과정을 진행해야 하는지 안다.TO-DO1. 설명을 할 수 있을 정도가 되야 한다.면접에서 이게 뭐냐고 물어보면 쉽게 핵심을 설명할 수 있어야 한다.지금은 하나도 설명할 수 없다.....용어도 하나씩 헷갈리기 시작하고 잊혀져간다....2. 아직 진행해야할 앞으로의 딥러닝 분야는 공부를 더 해야 한다.그냥 이렇구나 대충 이해..
1. 추가 데이터 통합외부 데이터: 공휴일, 기후 조건, 경제 지표 등 외부 데이터를 모델에 포함시키면 예측의 정확도를 높일 수 있습니다. Prophet은 공휴일과 특별 이벤트를 모델에 포함시키는 기능을 제공합니다.프로모션 데이터: 판매 촉진 행사 정보가 있다면, 이를 모델에 포함시켜 판매량 증가 예측을 개선할 수 있습니다.2. 하이퍼파라미터 조정계절성 조정: 주간, 연간 계절성의 파라미터를 조정하거나, 데이터에 맞는 새로운 계절성을 정의할 수 있습니다.변경점(changepoint) 조정: Prophet 모델의 변경점 감도를 조정하여 모델이 추세의 변화를 더 잘 감지하도록 할 수 있습니다. changepoint_prior_scale의 값을 조정해 보세요.3. 피쳐 엔지니어링라그 변수: 과거 판매 데이터의..
1. 추가 데이터 통합외부 데이터: 공휴일, 기후 조건, 경제 지표 등 외부 데이터를 모델에 포함시키면 예측의 정확도를 높일 수 있습니다. Prophet은 공휴일과 특별 이벤트를 모델에 포함시키는 기능을 제공합니다.프로모션 데이터: 판매 촉진 행사 정보가 있다면, 이를 모델에 포함시켜 판매량 증가 예측을 개선할 수 있습니다.2. 하이퍼파라미터 조정계절성 조정: 주간, 연간 계절성의 파라미터를 조정하거나, 데이터에 맞는 새로운 계절성을 정의할 수 있습니다.변경점(changepoint) 조정: Prophet 모델의 변경점 감도를 조정하여 모델이 추세의 변화를 더 잘 감지하도록 할 수 있습니다. changepoint_prior_scale의 값을 조정해 보세요.3. 피쳐 엔지니어링라그 변수: 과거 판매 데이터의..
- Total
- Today
- Yesterday
- classification
- 티스토리챌린지
- 리스트
- nlp
- 오블완
- Hugging Face
- 해시
- recursion #재귀 #자료구조 # 알고리즘
- Transformer
- Numpy
- 손실함수
- LIST
- git
- speaking
- 파이썬
- Array
- t5
- PEFT
- RAG
- Lora
- clustering
- #패스트캠퍼스 #패스트캠퍼스AI부트캠프 #업스테이지패스트캠퍼스 #UpstageAILab#국비지원 #패스트캠퍼스업스테이지에이아이랩#패스트캠퍼스업스테이지부트캠프
- English
- #패스트캠퍼스 #UpstageAILab #Upstage #부트캠프 #AI #데이터분석 #데이터사이언스 #무료교육 #국비지원 #국비지원취업 #데이터분석취업 등
- #패스트캠퍼스 #패스트캠퍼스ai부트캠프 #업스테이지패스트캠퍼스 #upstageailab#국비지원 #패스트캠퍼스업스테이지에이아이랩#패스트캠퍼스업스테이지부트캠프
- 코딩테스트
- Github
- Python
- cnn
- LLM
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |