'분류 전체보기' 카테고리의 글 목록 (5 Page)

AutoModel 과 기타 모델 호출 형태

의도: klue/roberta-base라는 모델을 AutoModel을 사용해 불러오고 있습니다.용도: 이 부분은 roberta-base 모델을 일반적인 사전 훈련된 형태로 불러오는 데 사용됩니다.from transformers import AutoModelmodel_id = 'klue/roberta-base'model = AutoModel.from_pretrained(model_id)RobertaModel( (embeddings): RobertaEmbeddings( (word_embeddings): Embedding(32000, 768, padding_idx=1) (position_embeddings): Embedding(514, 768, padding_idx=1) (token_type..

DeepLearning 2024. 10. 31. 12:03

DPO(Direct Preference Optimization)와 PPO(Proximal Policy Optimization)

DPO(Direct Preference Optimization)와 PPO(Proximal Policy Optimization)는 둘 다 모델의 출력을 선호도에 맞춰 최적화하는 방법이지만, 적용 방식과 학습 과정에서 큰 차이가 있습니다. 각각의 주요 목적, 적용 상황, 학습 과정의 차이점을 비교하여 설명하겠습니다.DPO와 PPO의 목적DPO (Direct Preference Optimization): 강화학습 없이도 모델의 출력을 선호도에 맞춰 직접 최적화합니다. 주로 언어 모델(Large Language Model, LLM)에서 특정 출력을 선호하도록 조정하는 데 사용되며, 인간의 피드백이나 사용자의 선호도를 바로 반영하여 빠르게 미세 조정할 수 있는 방법입니다.PPO (Proximal Policy Op..

DeepLearning 2024. 10. 31. 11:44

Hugging Face - Posts, Docs, Pricing

1.Posts이 화면은 Hugging Face의 Posts 페이지로, 커뮤니티의 최신 업데이트와 공지를 확인할 수 있는 공간입니다. 사용자가 팔로우하고 있는 프로젝트나 모델, 그리고 커뮤니티 멤버들이 올린 새로운 소식을 한눈에 볼 수 있습니다. 최근 활동 중인 사용자 목록도 오른쪽에 표시되어 있어, 활발히 활동하는 사용자들을 팔로우할 수 있습니다.주요 기능Posts:사용자들이 모델 업데이트, 새로운 기능, 연구 결과 등을 공유하는 게시물입니다. 예를 들어, 화면에 보이는 첫 번째 게시물에서는 "Cybertron V4" 모델이 업데이트되었다는 내용을 포함하고 있습니다.각 게시물에는 Reply 버튼을 눌러 댓글을 남길 수 있으며, 이를 통해 커뮤니티와 소통할 수 있습니다.Recently Active User..

DeepLearning 2024. 10. 30. 21:42

Hugging Face - Spaces

이 화면은 Hugging Face의 Spaces 페이지로, 다양한 AI 애플리케이션을 커뮤니티가 개발하여 공유하는 플랫폼입니다. Spaces는 주로 Gradio와 Streamlit 같은 도구를 통해 인터랙티브한 웹 애플리케이션을 손쉽게 만들고 배포할 수 있도록 지원합니다. 예를 들어, 텍스트 생성, 이미지 생성, 오디오 변환 등 다양한 태스크를 수행하는 AI 애플리케이션들이 여기에서 제공됩니다.주요 기능Spaces 검색 및 탐색:상단에 Search Spaces 검색창을 이용해 원하는 키워드를 입력하여 특정 애플리케이션을 찾을 수 있습니다.태스크별, 라이브러리별, 또는 기타 조건으로 Spaces를 필터링하여 원하는 주제나 기능의 애플리케이션을 찾을 수 있습니다.Spaces of the Week:주간 인기 ..

DeepLearning 2024. 10. 30. 21:30

Hugging Face - Datasets 알아보자

1. Main이 화면의 왼쪽에는 Hugging Face 데이터셋을 필터링할 수 있는 다양한 옵션이 제공됩니다. 각 필터 옵션은 다음과 같습니다:1. Modalities (형식)3D, Audio, Geospatial, Image, Tabular, Text, Time-series, Video와 같은 옵션이 있으며, 데이터의 종류에 따라 필터링할 수 있습니다.예를 들어, Text는 텍스트 데이터를, Audio는 음성 데이터를, Image는 이미지 데이터를 포함하는 데이터셋을 검색할 때 사용됩니다.2. Size (rows)데이터셋의 크기를 기준으로 필터링할 수 있는 슬라이더입니다.부터 >1T까지 데이터셋의 행(row) 수를 조절하여, 원하는 크기의 데이터셋만 표시할 수 있습니다. 예를 들어, 매우 큰 데이터셋이..

DeepLearning 2024. 10. 30. 21:16

Hugging Face - Models 알아보자

1. Tasks왼쪽 메뉴Tasks (태스크): 모델이 수행할 수 있는 작업 종류를 나열합니다. 여기에는 Multimodal (예: Image-Text-to-Text, Video-Text-to-Text), Computer Vision (예: Image Classification, Object Detection, Text-to-Image), Natural Language Processing (NLP) (예: Text Classification, Question Answering, Summarization) 등의 카테고리가 포함되어 있습니다. 사용자는 수행하고자 하는 태스크에 따라 원하는 모델을 쉽게 찾을 수 있습니다.Filter Tasks by name: 특정 태스크 이름을 입력하여 관련된 모델을 필터링할 ..

DeepLearning 2024. 10. 30. 20:42

Hugging Face 구성요소 및 활용방법

Hugging Face는 다양한 AI 도구와 라이브러리를 제공하는 플랫폼으로, 자연어 처리(NLP), 컴퓨터 비전, 음성 인식 등 여러 분야의 딥러닝 모델과 데이터셋을 쉽게 사용할 수 있게 설계되었습니다. 이 구조를 잘 이해하면 개발자로서 필요한 도구와 리소스를 빠르게 활용할 수 있습니다. 주요 구성 요소와 활용 방법을 정리해 보겠습니다.1. Transformers 라이브러리Hugging Face의 핵심 라이브러리로, 사전 학습된 Transformer 기반 모델(BERT, GPT, T5 등)을 쉽게 불러와 다양한 NLP 태스크(예: 텍스트 분류, 번역, 요약, 감정 분석)를 수행할 수 있습니다. 주요 함수:AutoModel 및 AutoTokenizer: 사전 학습된 모델과 토크나이저를 자동으로 불러옵니다..

DeepLearning 2024. 10. 30. 20:02

Safetensors

Safetensors는 모델의 전체 구조를 포함하는 것이 아니라, 모델의 가중치와 같은 텐서(tensor)만을 저장하고 로드하는 데 집중한 파일 형식입니다. 이 방식은 모델을 불러올 때 **구조적인 정보(예: 레이어, 활성화 함수 설정 등)**가 아닌, 단순히 가중치와 편향값 같은 수치 데이터만 불러오기 때문에 매우 효율적입니다.기존의 pickle 방식이나 일반 .pt 파일 형식에서는 모델의 모든 정보(구조와 가중치)를 포함하는 데 반해, Safetensors는 보안과 속도 최적화에 초점을 맞추어 텐서 데이터만 안전하게 저장하고 불러올 수 있도록 설계되었습니다. 이렇게 하면 텐서 데이터를 필요에 따라 여러 모델에 재사용하거나 맞춤형 모델 구조에 텐서 데이터만 로드할 수 있게 됩니다Hugging Face..

DeepLearning 2024. 10. 30. 19:59

문과생CS정복기

티스토리툴바

« 2024/12 »
일	월	화	수	목	금	토
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31