텐서란 무엇인가요?텐서는 숫자를 정리해서 담을 수 있는 상자와 비슷한 개념입니다. 텐서는 여러 차원의 데이터를 담을 수 있습니다. 예를 들어:스칼라 (0차원): 단일 숫자 (예: 5)벡터 (1차원): 숫자들의 리스트 (예: [1, 2, 3])행렬 (2차원): 숫자들의 2차원 배열 (예: [[1, 2], [3, 4]])3차원 이상의 텐서: 3차원, 4차원 등 더 높은 차원의 배열을 가질 수 있습니다.이미지 데이터를 텐서로 변환하는 이유컴퓨터는 숫자로 된 데이터를 이해할 수 있습니다. 그래서 이미지를 숫자로 변환해야 합니다. PyTorch에서 이미지를 다루기 위해 Tensor라는 특별한 숫자 배열을 사용합니다.예시 이미지 데이터가상의 이미지를 생각해봅시다. 이미지는 여러 색깔의 픽셀로 구성됩니다. 각 픽셀은..
다중 퍼셉트론(Multi-Layer Perceptron, MLP)은 인공지능과 머신러닝에서 사용하는 신경망의 한 종류입니다. 쉽게 말해서, MLP는 여러 층으로 이루어진 인공 신경망입니다. 각각의 층은 뉴런(또는 퍼셉트론)으로 구성되어 있으며, 뉴런은 입력 값을 받아서 계산을 수행한 후 출력을 생성합니다.다중 퍼셉트론을 쉽게 이해하기 위해 각 구성 요소를 하나씩 설명하겠습니다.1. 퍼셉트론(Perceptron)기본 단위: 퍼셉트론은 인공 신경망의 가장 기본 단위입니다.구성 요소: 입력 값, 가중치(weight), 바이어스(bias), 활성화 함수(activation function).동작: 입력 값에 가중치를 곱하고, 바이어스를 더한 후, 활성화 함수를 통해 최종 출력을 계산합니다.2. 다중 퍼셉트론(M..
NAND 게이트는 전자 회로에서 사용하는 기본 논리 게이트 중 하나로, "Not AND"의 줄임말입니다. 쉽게 말해서, NAND 게이트는 두 입력이 모두 참(True)일 때만 거짓(False)을 출력하고, 그 외의 경우에는 항상 참(True)을 출력합니다.NAND 게이트의 동작을 이해하기 쉽게 설명하자면:입력 A와 B가 둘 다 참(True)인 경우, 출력은 거짓(False)입니다.입력 A와 B 중 하나라도 거짓(False)인 경우, 출력은 참(True)입니다.한국어로 쉽게 풀어보면, NAND 게이트는 "둘 다 켜져 있으면 꺼지고, 하나라도 꺼져 있으면 켜진다"라고 생각할 수 있습니다.논리표(진리표)를 통해 다시 한번 정리해 보면:입력 A입력 B출력001011101110여기서 0은 거짓(False), 1은..
만약 sales를 X 변수에 포함하여 sales y를 예측하려고 한다면 ml돌릴 때 어떤 결과가 나올까?만약 sales 컬럼을 독립 변수(X)에 포함하여 sales를 종속 변수(y)로 예측하려고 한다면, 모델이 미래의 매출을 예측하기 위해 현재의 매출을 사용하게 되므로 데이터 누수(data leakage) 문제가 발생합니다. 이는 모델이 훈련 데이터에서 너무 많은 정보를 얻어 과적합(overfitting)하게 되어 테스트 데이터에서의 성능이 크게 떨어지는 원인이 됩니다.데이터 누수란?데이터 누수는 모델이 훈련 중에 예측하고자 하는 대상 변수와 관련된 정보를 부적절하게 사용하게 되는 상황을 말합니다. 이는 모델의 성능을 과대평가하게 만들며, 실제 예측 성능이 저하됩니다. 그러면 2주 간격의 요일별 평균 매..
GluonTS achieves high accuracy in time series forecasting for several reasons:1. Probabilistic Forecasting:Uncertainty Quantification: GluonTS provides probabilistic forecasts, which means it not only predicts the future values but also provides confidence intervals. This helps in understanding the range within which the actual values might fall.Advanced Probabilistic Models: GluonTS includes mo..
When it comes to time series forecasting, the performance of a model can be highly dependent on the specific characteristics of the data and the problem at hand. However, here is an overview of each of the mentioned libraries, along with their strengths and common use cases:blue-yonder/tsfresh:Strengths: tsfresh is a feature extraction library for time series data. It automatically extracts hund..
특성의 수를 줄이는 방법에는 여러 가지가 있습니다. 특성 선택(feature selection)과 차원 축소(dimensionality reduction)를 통해 불필요한 특성을 제거하거나 변환할 수 있습니다. 아래에 몇 가지 방법을 소개합니다.1. 특성 선택 (Feature Selection)1.1. 필터 방식 (Filter Method)통계적 방법을 사용하여 각 특성의 중요도를 평가하고, 중요도가 낮은 특성을 제거합니다.분산 임계값 (Variance Threshold): 분산이 낮은 특성을 제거합니다. from sklearn.feature_selection import VarianceThreshold selector = VarianceThreshold(threshold=0.1) X_reduced..
t-SNE(t-Distributed Stochastic Neighbor Embedding)은 고차원 데이터의 시각화를 위해 사용되는 차원 축소 기법입니다. 특히 데이터의 복잡한 구조와 클러스터를 저차원(주로 2차원 또는 3차원)으로 시각화하는 데 매우 효과적입니다.t-SNE의 주요 개념지역적 구조 보존:t-SNE는 고차원 데이터의 지역적 구조를 저차원 공간에서도 보존하려고 합니다. 즉, 고차원 공간에서 가까운 데이터 포인트들이 저차원 공간에서도 가깝게 유지되도록 합니다.확률 분포:고차원 공간에서 데이터 포인트 쌍 간의 유사도를 확률 분포로 변환합니다. 저차원 공간에서도 동일한 방식으로 확률 분포를 생성하여 두 분포 간의 차이를 최소화하는 방식으로 차원을 축소합니다.쿨백-라이블러 발산 (KL Diverge..
- Total
- Today
- Yesterday
- 파이썬
- clustering
- Numpy
- Hugging Face
- nlp
- speaking
- cnn
- Lora
- git
- t5
- #패스트캠퍼스 #패스트캠퍼스ai부트캠프 #업스테이지패스트캠퍼스 #upstageailab#국비지원 #패스트캠퍼스업스테이지에이아이랩#패스트캠퍼스업스테이지부트캠프
- 오블완
- English
- 티스토리챌린지
- LIST
- RAG
- 손실함수
- 해시
- classification
- 코딩테스트
- #패스트캠퍼스 #패스트캠퍼스AI부트캠프 #업스테이지패스트캠퍼스 #UpstageAILab#국비지원 #패스트캠퍼스업스테이지에이아이랩#패스트캠퍼스업스테이지부트캠프
- #패스트캠퍼스 #UpstageAILab #Upstage #부트캠프 #AI #데이터분석 #데이터사이언스 #무료교육 #국비지원 #국비지원취업 #데이터분석취업 등
- LLM
- PEFT
- Github
- 리스트
- recursion #재귀 #자료구조 # 알고리즘
- Array
- Transformer
- Python
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |