의도: klue/roberta-base라는 모델을 AutoModel을 사용해 불러오고 있습니다.용도: 이 부분은 roberta-base 모델을 일반적인 사전 훈련된 형태로 불러오는 데 사용됩니다.from transformers import AutoModelmodel_id = 'klue/roberta-base'model = AutoModel.from_pretrained(model_id)RobertaModel( (embeddings): RobertaEmbeddings( (word_embeddings): Embedding(32000, 768, padding_idx=1) (position_embeddings): Embedding(514, 768, padding_idx=1) (token_type..
DPO(Direct Preference Optimization)와 PPO(Proximal Policy Optimization)는 둘 다 모델의 출력을 선호도에 맞춰 최적화하는 방법이지만, 적용 방식과 학습 과정에서 큰 차이가 있습니다. 각각의 주요 목적, 적용 상황, 학습 과정의 차이점을 비교하여 설명하겠습니다.DPO와 PPO의 목적DPO (Direct Preference Optimization): 강화학습 없이도 모델의 출력을 선호도에 맞춰 직접 최적화합니다. 주로 언어 모델(Large Language Model, LLM)에서 특정 출력을 선호하도록 조정하는 데 사용되며, 인간의 피드백이나 사용자의 선호도를 바로 반영하여 빠르게 미세 조정할 수 있는 방법입니다.PPO (Proximal Policy Op..
1.Posts이 화면은 Hugging Face의 Posts 페이지로, 커뮤니티의 최신 업데이트와 공지를 확인할 수 있는 공간입니다. 사용자가 팔로우하고 있는 프로젝트나 모델, 그리고 커뮤니티 멤버들이 올린 새로운 소식을 한눈에 볼 수 있습니다. 최근 활동 중인 사용자 목록도 오른쪽에 표시되어 있어, 활발히 활동하는 사용자들을 팔로우할 수 있습니다.주요 기능Posts:사용자들이 모델 업데이트, 새로운 기능, 연구 결과 등을 공유하는 게시물입니다. 예를 들어, 화면에 보이는 첫 번째 게시물에서는 "Cybertron V4" 모델이 업데이트되었다는 내용을 포함하고 있습니다.각 게시물에는 Reply 버튼을 눌러 댓글을 남길 수 있으며, 이를 통해 커뮤니티와 소통할 수 있습니다.Recently Active User..
이 화면은 Hugging Face의 Spaces 페이지로, 다양한 AI 애플리케이션을 커뮤니티가 개발하여 공유하는 플랫폼입니다. Spaces는 주로 Gradio와 Streamlit 같은 도구를 통해 인터랙티브한 웹 애플리케이션을 손쉽게 만들고 배포할 수 있도록 지원합니다. 예를 들어, 텍스트 생성, 이미지 생성, 오디오 변환 등 다양한 태스크를 수행하는 AI 애플리케이션들이 여기에서 제공됩니다.주요 기능Spaces 검색 및 탐색:상단에 Search Spaces 검색창을 이용해 원하는 키워드를 입력하여 특정 애플리케이션을 찾을 수 있습니다.태스크별, 라이브러리별, 또는 기타 조건으로 Spaces를 필터링하여 원하는 주제나 기능의 애플리케이션을 찾을 수 있습니다.Spaces of the Week:주간 인기 ..
1. Main이 화면의 왼쪽에는 Hugging Face 데이터셋을 필터링할 수 있는 다양한 옵션이 제공됩니다. 각 필터 옵션은 다음과 같습니다:1. Modalities (형식)3D, Audio, Geospatial, Image, Tabular, Text, Time-series, Video와 같은 옵션이 있으며, 데이터의 종류에 따라 필터링할 수 있습니다.예를 들어, Text는 텍스트 데이터를, Audio는 음성 데이터를, Image는 이미지 데이터를 포함하는 데이터셋을 검색할 때 사용됩니다.2. Size (rows)데이터셋의 크기를 기준으로 필터링할 수 있는 슬라이더입니다.부터 >1T까지 데이터셋의 행(row) 수를 조절하여, 원하는 크기의 데이터셋만 표시할 수 있습니다. 예를 들어, 매우 큰 데이터셋이..
1. Tasks왼쪽 메뉴Tasks (태스크): 모델이 수행할 수 있는 작업 종류를 나열합니다. 여기에는 Multimodal (예: Image-Text-to-Text, Video-Text-to-Text), Computer Vision (예: Image Classification, Object Detection, Text-to-Image), Natural Language Processing (NLP) (예: Text Classification, Question Answering, Summarization) 등의 카테고리가 포함되어 있습니다. 사용자는 수행하고자 하는 태스크에 따라 원하는 모델을 쉽게 찾을 수 있습니다.Filter Tasks by name: 특정 태스크 이름을 입력하여 관련된 모델을 필터링할 ..
Hugging Face는 다양한 AI 도구와 라이브러리를 제공하는 플랫폼으로, 자연어 처리(NLP), 컴퓨터 비전, 음성 인식 등 여러 분야의 딥러닝 모델과 데이터셋을 쉽게 사용할 수 있게 설계되었습니다. 이 구조를 잘 이해하면 개발자로서 필요한 도구와 리소스를 빠르게 활용할 수 있습니다. 주요 구성 요소와 활용 방법을 정리해 보겠습니다.1. Transformers 라이브러리Hugging Face의 핵심 라이브러리로, 사전 학습된 Transformer 기반 모델(BERT, GPT, T5 등)을 쉽게 불러와 다양한 NLP 태스크(예: 텍스트 분류, 번역, 요약, 감정 분석)를 수행할 수 있습니다. 주요 함수:AutoModel 및 AutoTokenizer: 사전 학습된 모델과 토크나이저를 자동으로 불러옵니다..
Safetensors는 모델의 전체 구조를 포함하는 것이 아니라, 모델의 가중치와 같은 텐서(tensor)만을 저장하고 로드하는 데 집중한 파일 형식입니다. 이 방식은 모델을 불러올 때 **구조적인 정보(예: 레이어, 활성화 함수 설정 등)**가 아닌, 단순히 가중치와 편향값 같은 수치 데이터만 불러오기 때문에 매우 효율적입니다.기존의 pickle 방식이나 일반 .pt 파일 형식에서는 모델의 모든 정보(구조와 가중치)를 포함하는 데 반해, Safetensors는 보안과 속도 최적화에 초점을 맞추어 텐서 데이터만 안전하게 저장하고 불러올 수 있도록 설계되었습니다. 이렇게 하면 텐서 데이터를 필요에 따라 여러 모델에 재사용하거나 맞춤형 모델 구조에 텐서 데이터만 로드할 수 있게 됩니다Hugging Face..
- Total
- Today
- Yesterday
- Array
- #패스트캠퍼스 #UpstageAILab #Upstage #부트캠프 #AI #데이터분석 #데이터사이언스 #무료교육 #국비지원 #국비지원취업 #데이터분석취업 등
- English
- Numpy
- 리스트
- nlp
- #패스트캠퍼스 #패스트캠퍼스ai부트캠프 #업스테이지패스트캠퍼스 #upstageailab#국비지원 #패스트캠퍼스업스테이지에이아이랩#패스트캠퍼스업스테이지부트캠프
- 티스토리챌린지
- Lora
- LIST
- #패스트캠퍼스 #패스트캠퍼스AI부트캠프 #업스테이지패스트캠퍼스 #UpstageAILab#국비지원 #패스트캠퍼스업스테이지에이아이랩#패스트캠퍼스업스테이지부트캠프
- classification
- 파이썬
- cnn
- Github
- PEFT
- Transformer
- 해시
- 손실함수
- 코딩테스트
- 오블완
- clustering
- git
- recursion #재귀 #자료구조 # 알고리즘
- Hugging Face
- Python
- LLM
- RAG
- speaking
- t5
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |