import pandas as pd셀트리온_df=pd.read_excel(r'C:\Users\user\Downloads\셀트리온_20200501-20210501.xlsx')셀트리온_df['일자'] = 셀트리온_df['일자'].astype('str')# 한 날짜로 데이터 합치기pv_0 = pd.pivot_table(셀트리온_df, values='제목', index='일자', aggfunc='sum')pv_0.reset_index(inplace=True)pv_0.columns.valuespv_0from sklearn.feature_extraction.text import TfidfVectorizerimport numpy as npfrom datetime import datetime, timedelta#최종 ..
날짜 형식이 있는 데이터가 있다면 데이터를 다루기 전 컬럼을 datetime type으로 설정해 주는 것이 좋다.왜냐하면 여러 데이터들을 다룰 때 날짜로 join해주는 경우가 많기 때문이다. 이 때 datatype을 통일해줘야 편하다.또한 날짜 컬럼을 활용하여 년,월,일,주,요일 등의 기준으로 데이터를 가공하게 되는 경우가 많기 때문에 datetime 형식으로 바꿔줘야 한다.날짜 컬럼이 있다면 먼저 컬럼의 datatype을 확인해야 한다.예를 들어 20210130 와 같은 데이터가 들어 있어도 int형일 수 있으므로 dataframe.info() 를 통해 컬럼의 datatype을 확인해야 한다.위에서 보면 일자 컬럼이 int64형이다.import datetimeSM_sc_df['일자'] = pd.to_d..
import pandas as pdfrom datetime import datetime, timedelta# 시작 날짜와 종료 날짜 설정start_date = datetime(2019, 1, 2).date()end_date = datetime(2023, 12, 31).date()# 날짜를 datetime 형식으로 변환kosdaq_20192023['일자'] = pd.to_datetime(kosdaq_20192023['일자']).dt.date# 누락된 날짜에 대한 데이터 채우기current_date = start_datewhile current_date #if current_date not in kosdaq_20192023['일자']: if not kosdaq_20192023['일자'].isin..
3x3 크기의 numpy 배열(행렬)을 만드는 방법은 여러 가지가 있습니다. 배열의 내용이 무엇인지에 따라 적절한 함수를 선택할 수 있습니다. 예를 들어, 모든 요소가 0인 배열, 또는 모든 요소가 1인 배열, 또는 무작위 값을 가진 배열 등을 만들 수 있습니다. 여기 몇 가지 예시를 드리겠습니다:모든 요소가 0인 배열:import numpy as npzeros_array = np.zeros((3, 3))print(zeros_array)모든 요소가 1인 배열:import numpy as npones_array = np.ones((3, 3))print(ones_array)무작위 값이 포함된 배열:import numpy as nprandom_array = np.random.rand(3, 3)print(ran..
💡 input() 💡 input(). split()1234 입력 1 2 3 4 띄어써서 입력 💡 map()1 2 3 4 입력하면 map함수 객체 자체를 뱉어낸다. 1 2 3 4 입력하면 map함수 객체 자체를 뱉어낸다. 1 2 3 4 띄어써서 입력하면 map함수는 못받아들인다.map(int, input())은 input()으로 받은 문자열의 각 문자를 int 함수에 전달한다. 그러므로 각 문자는 숫자로 변환되어야 합니다."1 2 3 4" 문자열에서 각 문자('1', ' ', '2', ' ', '3', ' ', '4')는 개별적으로 처리된다. 여기서 숫자가 아닌 공백 문자(' ')는 int 함수로 변환할 수 없기 때문에 ValueError가 발생한다. 💡 map() 결과를 list로 받기1 2 3 ..
Python에서 문자열에서 공백을 제거하는 방법에는 여러 가지가 있습니다. 여기에는 모든 공백을 제거하는 방법과 문자열 양쪽 끝의 공백만을 제거하는 방법 등이 포함됩니다.1. 양쪽 끝의 공백 제거문자열의 양쪽 끝에서 공백을 제거하려면 strip() 메서드를 사용합니다. 이는 줄바꿈, 탭, 스페이스 등을 포함한 모든 종류의 공백 문자를 제거합니다.original_string = " Hello, World! "trimmed_string = original_string.strip()print(trimmed_string) # 출력: "Hello, World!"2. 모든 공백 제거문자열 내의 모든 공백을 제거하려면 replace() 메서드를 사용하거나 문자열을 반복하면서 공백이 아닌 문자만을 추출할 수 있습..
원본: 패스트캠퍼스 파이썬으로 할 수 있는 모든 것 중 김판다님 강의파트김판다님의 유투브는 여기를 클릭하세요김판다님의 블로그는 여기를 클릭하세요# 실습 준비 코드import pandas as pddata = [['A', 10, 30], ['B', 20, 40], ['C', 15, 35]]df = pd.DataFrame(data, columns=['반', '남', '여'])df# melt로 언피벗df.melt('반')# 언피벗 후 열 이름 바꾸기 (함수이용)df.melt('반').set_axis(['반', '성별', '인원수'], axis=1)# 언피벗 후 열 이름 바꾸기 (melt의 인자 이용)df.melt('반', var_name='성별', value_name='인원수') 2024.04.30 - [P..
원본: 패스트캠퍼스 파이썬으로 할 수 있는 모든 것 중 김판다님 강의파트김판다님의 유투브는 여기를 클릭하세요.김판다님의 블로그는 여기를 클릭하세요# 실습 준비 코드import pandas as pddata1 = [[10, 20, 30, 40], [15, 25, 35, 45]]data2 = [[10, 30], [20, 40], [15, 35]]col1 = pd.MultiIndex.from_product([['남', '여'], ['A반', 'B반']])df1 = pd.DataFrame(data1, index=['1학년', '2학년'], columns=col1)df2 = pd.DataFrame(data2, index=list('ABC'), columns=['남', '여'])stack실습하기df1# stack으..
- Total
- Today
- Yesterday
- LLM
- 손실함수
- 코딩테스트
- #패스트캠퍼스 #UpstageAILab #Upstage #부트캠프 #AI #데이터분석 #데이터사이언스 #무료교육 #국비지원 #국비지원취업 #데이터분석취업 등
- #패스트캠퍼스 #패스트캠퍼스AI부트캠프 #업스테이지패스트캠퍼스 #UpstageAILab#국비지원 #패스트캠퍼스업스테이지에이아이랩#패스트캠퍼스업스테이지부트캠프
- Github
- 오블완
- 해시
- RAG
- 리스트
- 파이썬
- 티스토리챌린지
- Numpy
- Transformer
- English
- git
- Hugging Face
- Lora
- PEFT
- LIST
- #패스트캠퍼스 #패스트캠퍼스ai부트캠프 #업스테이지패스트캠퍼스 #upstageailab#국비지원 #패스트캠퍼스업스테이지에이아이랩#패스트캠퍼스업스테이지부트캠프
- Python
- recursion #재귀 #자료구조 # 알고리즘
- classification
- t5
- nlp
- cnn
- speaking
- clustering
- Array
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |