본문 바로가기 메뉴 바로가기

문과생CS정복기

프로필사진
  • 글쓰기
  • 관리
  • 태그
  • 방명록
  • RSS

문과생CS정복기

검색하기 폼
  • 분류 전체보기 (304)
    • Upstage AI 3기 (27)
      • 패스트러너_기자단 (8)
      • 프로젝트_개인회고 (4)
    • CS기초 (2)
    • Python (46)
    • DeepLearning (97)
      • CV (3)
      • NLP (43)
    • ML (52)
    • 코딩테스트 (12)
    • 통계 (14)
    • 개인프로젝트 (0)
    • 블로그 (30)
    • 비지니스영어회화 (16)
    • 부동산 (1)
  • 방명록

전체 글 (304)
이진분류Binary Classification/ 로지스틱 회귀Logistic Regression/ 이진 크로스엔트로피 손실 함수Binary Cross-Entropy Loss Function

이진분류는 트레이닝 데이터의 특성과 그들간의 상관관계를 분석하여, 임의의 입력데이터를 사전에 정의된 두 가지 범주중 하나로 분류할 수 있는 예측모델을 만드는 과정이메일 스팸 분류, Spam(1) 또는 Ham(0)금융 사기 탐지, 사기 거래(1) 또는 정상 거래(0)의료 진단, 암 조직(1) 또는 정상 조직(0) 로지스틱 회귀 알고리즘은①트레이닝 데이터의 특성과 분포를 나타내는 최적의 직선을 찾고,②해당 직선을 기준으로 데이터를 위(1)나 아래(0) 또는 왼쪽(1)이나 오른쪽(0) 등으로 분류하는 방법입니다.이러한 로지스틱 회귀는 이진분류 시스템의 알고리즘 중에서도 정확도가 높은 알고리즘으로 알려져 있어서 딥러닝에서도기본적인 컴포넌트로 사용되고 있습니다.  로지스틱 회귀 알고리즘을 도식화하면 다음과 같습니..

통계 2024. 4. 25. 19:53
선형회귀 Linear Regression / 손실함수 Loss function

선형회귀는 트레이닝 데이터를 사용하여 데이터의 특성과 상관관계를 분석하고, 이를 기반으로 모델을 학습시켜, 트레이닝데이터에 포함되지 않은 새로운 데이터에 대한 결과를 연속적인 숫자값으로 예측하는 과정입니다.부동산 가격 예측: 주택의 평균 방 개수(feature), 주택의 가격(target)임금 결정: 경력(feature), 특정 직원의 예상임금(target)선형회귀시스템에서의 학습이란 트레이닝 데이터의 분석을 통해 데이터의 분포를 가장 잘 표현하는 선형관계를 나타내는일차함수의 가중치𝑾와 바이어스𝒃를 찾아가는 과정입니다.여기에서 중요한 것은 직선 𝒚 = 𝑾𝒙 + 𝒃 함수의 계산 값 𝒚와 정답 𝒕의 차이(오차)를 최대한 작게 만드는 것입니다. 주어진 트레이닝 데이터를 바탕으로 오차들의 합, 즉..

통계 2024. 4. 25. 17:35
상관분석 Correlation Analysis

ANOVA가 그룹 간의 평균 차이를 분석하는 데 중점을 두는 반면, 상관분석은 변수들 사이의 어느 정도의 선형적 관계가 있는지 파악하는 데 초점을 맞춥니다. 다음은 한 반의 학생 20명의 수학과 과학 점수를 조사한 것입니다.import matplotlib.pyplot as pltimport numpy as npimport scipy as spx = [90, 64, 94, 57, 82, 92, 84, 72, 52, 86, 73, 82, 78, 68, 54, 92, 65, 76, 83, 95]y = [86, 65, 89, 62, 74, 64, 98, 85, 62, 84, 84, 83, 59, 64, 55, 95, 70, 72, 88, 93]plt.scatter(x, y, color='b', s=20)plt...

통계 2024. 4. 25. 15:31
이원분산분석 Two-way ANOVA/ 상호작용 효과 Interaction effect

이원분산분석두가지 기준이 되는 요인으로 비교하고자 하는 변수의 평균 차이가 집단 간에 존재하는지를 조사하는 것입니다. 즉,요인이 2개일때, 분산의 원인이 어디에 있는지를 밝힘으로써 요인에 영향이 있는가를 알 수 있습니다.술의 종류와 흡연 여부가 인간의 반응 시간에 미치는 영향교수법과 보상방법이 학업성취도에 미치는 영향편의점브랜드와 상권이 만족도에 미치는 영향 상호작용 효과이원분산분석이 일원분산분석과 다른 점은 요인이 두 개라는것입니다. 일원분산분석에서는편의점브랜드에 따른 만족도라는 1:1 요인에 따라 나타나는 측정치에 대해 평균비교를 하지만 이원분산분석에서는 기준이 되는 요인이 두 개이기 때문에 요인이 독립적으로 변수에 미치는 영향의 평균차이를 확인하는 주효과 검정 뿐만 아니라 요인들이 연관되어 변수에 ..

통계 2024. 4. 25. 15:12
일원분산분석 One-Way ANOVA / 사후분석 post-hoc analysis

일원분산분석이란 독립변수가 하나일 때 분산의 원인이 집단 간 차이에 기인한 것인지를 분석하는 통계적 방법인종간 지능의 차이사회계층에 따른 사회에 대한 만족도 차이교수법에 따른 학업 성취의 차이 예시: 편의점 종류에 따라 고객의 만족도에 차이가 있을까?귀무가설:편의점 종류에 따른 고객의 만족도에는 차이가 없다.대립가설:편의점 종류에 따른 고객의 만족도에는 차이가 있다. 다음 코드를 통해 ANOVA분석을 실행해보자.import scipy as spimport numpy as npimport pingouin as pg# 데이터 생성data = { 'store': [1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3], ..

통계 2024. 4. 25. 12:34
t-test t검정/ ANOVA 분산분석

ANOVA(분산분석)와 t-검정 모두 통계적 방법으로 그룹 간 차이를 검증하는데 사용됩니다. 그러나 각 방법은 서로 다른 상황과 요구 사항에 맞춰 설계되었습니다. 유치원생도 이해할 수 있게 간단히 비교 설명해 보겠습니다.t-검정t-검정은 주로 두 그룹 간의 평균 차이를 비교할 때 사용됩니다. 예를 들어, 두 개의 사탕 봉지가 있고 각 봉지에서 나온 사탕의 수를 비교하고 싶을 때 t-검정을 사용할 수 있습니다.독립표본 t-검정: 두 그룹이 서로 독립적일 때 사용합니다. 예를 들어, 두 다른 클래스의 학생들의 시험 점수를 비교할 때 사용할 수 있습니다.종속표본 t-검정: 같은 그룹의 참가자들에게서 얻은 두 데이터를 비교할 때 사용합니다. 예를 들어, 한 학급 학생들이 특정 시험을 치르기 전과 후의 점수를 비..

통계 2024. 4. 25. 11:45
종속표본 t-test t검정

stats.bartlett과 stats.ttest_ind는 서로 다른 목적을 가진 두 가지 통계적 검정 함수입니다. 각각의 함수가 어떤 목적으로 사용되는지, 그리고 어떤 통계적 가설을 테스트하는지 살펴보겠습니다.1. stats.bartlett목적: Bartlett의 검정은 두 개 이상의 독립 표본의 분산이 동일한지(등분산성) 검정합니다. 이 검정은 ANOVA(분산분석)를 실시하기 전에 데이터가 등분산성 가정을 충족하는지 확인하기 위해 사용됩니다.사용 예: 여러 그룹의 데이터가 같은 분산을 가지고 있는지를 확인하고 싶을 때 사용합니다. import scipy.stats as stats# 분산이 다를 것으로 예상되는 데이터 생성group1 = np.random.normal(100, 10, 30)group2 ..

통계 2024. 4. 25. 11:37
독립표본 / 종속표본 / t-test t검정/ t-stat t통계량/ p-value유의확률/ two-tailed test양측검정

독립표본 (Independent Samples)상상해 보세요, 유치원에서 두 개의 다른 반에 있는 아이들이 있어요. 하나는 '해님 반'이고 다른 하나는 '달님 반'이에요. 이 두 반의 아이들은 서로 다른 반에서 다른 선생님과 활동을 해요. 이제 만약 우리가 '해님 반' 아이들과 '달님 반' 아이들의 키를 비교하고 싶다면, 우리는 두 개의 독립적인 그룹, 즉 독립표본을 가지고 있는 것이죠. 이 두 그룹은 서로 관련이 없으며, 각자 다른 환경에서 자라나고 있어요.종속표본 (Dependent Samples)이번에는 '해님 반'의 아이들이 어떻게 성장하는지 알아보고 싶다고 생각해 보세요. 우리는 같은 '해님 반' 아이들을 가을에 한 번, 봄에 한 번 측정해 그 아이들이 얼마나 클까를 알아볼 수 있어요. 이 경우..

통계 2024. 4. 25. 11:09
이전 1 ··· 31 32 33 34 35 36 37 38 다음
이전 다음
250x250
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
TAG
  • #패스트캠퍼스 #패스트캠퍼스AI부트캠프 #업스테이지패스트캠퍼스 #UpstageAILab#국비지원 #패스트캠퍼스업스테이지에이아이랩#패스트캠퍼스업스테이지부트캠프
  • Array
  • git
  • 코딩테스트
  • Hugging Face
  • LLM
  • 리스트
  • speaking
  • RAG
  • PEFT
  • 손실함수
  • 해시
  • clustering
  • 파이썬
  • 티스토리챌린지
  • Lora
  • #패스트캠퍼스 #UpstageAILab #Upstage #부트캠프 #AI #데이터분석 #데이터사이언스 #무료교육 #국비지원 #국비지원취업 #데이터분석취업 등
  • Transformer
  • cnn
  • t5
  • Github
  • 오블완
  • Python
  • LIST
  • #패스트캠퍼스 #패스트캠퍼스ai부트캠프 #업스테이지패스트캠퍼스 #upstageailab#국비지원 #패스트캠퍼스업스테이지에이아이랩#패스트캠퍼스업스테이지부트캠프
  • recursion #재귀 #자료구조 # 알고리즘
  • nlp
  • English
  • Numpy
  • classification
more
«   2025/01   »
일 월 화 수 목 금 토
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31
글 보관함

Blog is powered by Tistory / Designed by Tistory

티스토리툴바