베타 계수(𝛽) 추정 방법회귀 분석에서 우리는 데이터의 패턴을 찾기 위해 베타 계수(𝛽)를 추정합니다. 베타 계수는 각 독립 변수(특성)가 종속 변수(결과)에 얼마나 영향을 미치는지를 나타냅니다.기본 개념목표: 우리가 찾고자 하는 것은 회귀 계수인 베타(𝛽)입니다. 이 값들을 알아내면, 모델이 주어진 독립 변수들을 사용하여 결과를 예측할 수 있습니다.편미분: 수학적으로 베타 계수를 찾기 위해, 우리는 손실 함수(Loss Function)를 사용합니다. 손실 함수는 모델의 예측값과 실제값 간의 차이를 측정하는 함수입니다. 이 손실 함수를 최소화하려면, 각 베타(𝛽)에 대해 편미분을 사용하여 최소값을 찾습니다.손실 함수선형 회귀의 손실 함수는 일반적으로 잔차 제곱합(Residual Sum of Squ..
머신러닝모델의 예측오류를 구성하는 세 가지 요소이 공식은 머신 러닝 모델의 예측 오류를 구성하는 세 가지 주요 요소를 설명하는 데 사용됩니다. 이를 이해하는 것은 모델의 성능을 최적화하고 과적합(overfitting)과 과소적합(underfitting)을 방지하는 데 중요한 개념입니다.1. 노이즈(Noise)정의: 노이즈는 데이터 자체의 불확실성이나 무작위성을 나타냅니다. 이는 측정 오류, 데이터 수집 과정의 변동성 등과 같은 요인으로 인해 발생합니다.특징: 노이즈는 모델이 설명할 수 없는 부분이므로, 노이즈를 줄이는 것은 모델링 과정에서 불가능합니다.2. 분산(Variance)정의: 추정 값(Algorithm Output)의 평균과 추정 값 (Algorithm Output) 들 간의 차이. 분산은 학습..
라쏘(Lasso)와 리지(Ridge)는 회귀 분석에서 자주 사용되는 두 가지 규제(regularization) 기법입니다만 다른 머신러닝모델에서도 활용될 수 있습니다. 이들은 모델의 복잡도를 조절하여 과적합(overfitting)을 방지하고, 예측 성능을 향상시키는 데 도움을 줍니다. 간단히 설명하면 다음과 같습니다.라쏘 회귀란 무엇인가요?라쏘 회귀는 데이터 분석에서 예측 모델을 만드는 방법 중 하나입니다. 특히, 데이터에 많은 특성(변수)이 있을 때 중요한 특성만을 선택해 주는 방법입니다.라쏘 회귀의 기본 개념Least Absolute Shrinkage and Selection Operator (Lasso):이름의 의미: '최소 절대 축소 및 선택 연산자'라는 뜻입니다.목표: 중요한 특성만 남기고 불필..
해시로 풀어보기https://school.programmers.co.kr/learn/courses/30/lessons/42577def solution(phone_book): answer = True hash_map = {} # 해시맵 key값에 phonenumber를 담는다. for phone in phone_book: hash_map[phone] = 0 for phone in phone_book: prefix ='' # phonenumber를 for문에서 돌려주면 각각 한 자리씩 자를 수 있다. # 한 자리씩 계속 더하면서 기존의 해시맵에 들어있는 phonenumber와 비교한다. for char..
데이터 변환 (data transformation) 데이터 변환(data transformation)은 원본 데이터를 분석, 모델링 또는 다른 작업을 위해 더 적합하게 만드는 일련의 작업을 의미합니다. 데이터 변환은 다양한 방법을 통해 수행될 수 있으며, 여기에는 스케일링, 정규화, 차원 축소 등이 포함됩니다. 일반적으로 데이터 변환은 데이터 전처리 과정의 일환으로 수행됩니다.아래에서는 데이터 변환의 주요 기법 몇 가지를 소개하고, 이를 실제 코드로 보여드리겠습니다.1. 스케일링(Scaling)데이터의 값을 특정 범위로 조정하는 작업입니다. 주로 사용되는 방법은 다음과 같습니다:표준화(Standardization): 데이터를 평균이 0, 표준편차가 1이 되도록 변환합니다.최소-최대 스케일링(Min-Max..
set을 활용한 포켓몬 문제 풀이https://school.programmers.co.kr/learn/courses/30/lessons/1845아무리 풀어도 도저히 해시 방법으로 풀 수 없어서 아래와 같이 풀었다.def solution(nums): unique_pokemon_n = len(set(nums)) N = len(nums)//2 return min(unique_pokemon_n, N)ChatGPT에게 이 방법을 해시로 풀어달라고 했더니 이게 해시를 사용한 방법이라고 한다. 딕셔너리 자료구조를 사용한 풀이이게 무슨 소리야? 난 중복제거 set 자료구조를 사용한건데?맞습니다. 일반적으로 해시를 이용한 자료 구조는 키-값 쌍을 사용하는 딕셔너리 또는 해시맵을 떠올리게 됩니다. ..
해시맵의 주요 개념과 특징해시맵(HashMap)은 데이터를 키-값 쌍(Key-Value Pair)으로 저장하고 빠르게 검색할 수 있도록 도와주는 자료 구조입니다. 해시맵은 해시 함수를 사용하여 데이터를 저장하고 검색합니다.다음은 해시맵의 주요 개념과 특징입니다:키-값 쌍: 해시맵은 데이터를 키와 값의 쌍으로 저장합니다. 예를 들어, 이름을 키로 하고 전화번호를 값으로 저장할 수 있습니다.해시 함수: 키를 해시 함수에 입력하여 해시 값을 생성합니다. 이 해시 값은 해시맵에서 해당 키-값 쌍이 저장될 위치를 결정합니다.빠른 검색: 해시맵은 키를 통해 값을 빠르게 검색할 수 있습니다. 이는 해시 함수 덕분에 거의 일정한 시간 안에 검색이 가능하기 때문입니다.충돌 처리: 두 개 이상의 키가 동일한 해시 값을 가..
부트캠프가 진행된지 벌써 두 달이 다되어 갑니다. '꼬꼬마코더' 는 그간 강사님의 강의에 성실히 임했고 팀 프로젝트도 별탈없이 마쳤습니다. 비전공자인 제가 이렇게 스케쥴을 따라갈 수 있었던 것은 세 가지 요인 때문입니다. 첫째, 이미 접해본 내용이다. 비전공자이지만 짧은 기간 회사를 다니면서 정말 별별 프로젝트를 다 맡아 했습니다. 웹프론트부터 SQL데이터제공, 텍스트마이닝, 하둡 리눅스 관리까지 CS기초가 없어도 닥치면 닥치는대로 독학해서 프로젝트에 나가서 납기기한을 지켰죠. 모르면 다짜고짜 후배들 선배들 잡아다가 이거 어떻게 하냐고 그자리에서 해결할 때까지 붙잡고 보내지 않았습니다. 그렇게 빡세게 굴렀던 지난 시간들이 체화가 되었는지 부트캠프의 강의들을 큰 무리없이 따라갈 수 있었습니다. 코딩에 ..
- Total
- Today
- Yesterday
- Github
- 오블완
- Hugging Face
- git
- Python
- Array
- English
- clustering
- 해시
- Transformer
- #패스트캠퍼스 #UpstageAILab #Upstage #부트캠프 #AI #데이터분석 #데이터사이언스 #무료교육 #국비지원 #국비지원취업 #데이터분석취업 등
- nlp
- Lora
- cnn
- #패스트캠퍼스 #패스트캠퍼스AI부트캠프 #업스테이지패스트캠퍼스 #UpstageAILab#국비지원 #패스트캠퍼스업스테이지에이아이랩#패스트캠퍼스업스테이지부트캠프
- t5
- 코딩테스트
- 리스트
- PEFT
- 파이썬
- recursion #재귀 #자료구조 # 알고리즘
- LLM
- RAG
- 티스토리챌린지
- speaking
- 손실함수
- #패스트캠퍼스 #패스트캠퍼스ai부트캠프 #업스테이지패스트캠퍼스 #upstageailab#국비지원 #패스트캠퍼스업스테이지에이아이랩#패스트캠퍼스업스테이지부트캠프
- classification
- LIST
- Numpy
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |