Tesseract OCR의 인식률을 향상시키기 위해 파라미터를 조정하는 것은 좋은 접근 방법입니다. 여기서 사용된 파라미터 --oem과 --psm은 OCR 엔진 모드와 페이지 세그먼트 모드를 설정하는데, 이들을 적절히 조정하여 더 나은 결과를 얻을 수 있습니다. 다음은 각 파라미터에 대한 설명과 함께 다른 설정을 시도할 수 있는 몇 가지 제안입니다:OEM (OCR Engine Mode) 옵션:--oem 0: 오직 Tesseract 기반 엔진만 사용.--oem 1: 오직 LSTM 기반 엔진만 사용.--oem 2: Tesseract + LSTM 엔진 모두 사용.--oem 3: 사용 가능한 엔진을 자동으로 선택.여기서는 --oem 3을 사용하여 자동 선택을 하고 있습니다. 텍스트의 특성에 따라 LSTM만 사용..
img_size를 조정하는 것은 데이터와 모델 아키텍처에 따라 다양한 영향을 미칠 수 있습니다. 일반적으로, 이미지 크기를 조정할 때 몇 가지 고려사항이 있습니다:모델 아키텍처: 일부 딥러닝 모델은 특정 입력 크기에 최적화되어 설계될 수 있습니다. 예를 들어, 많은 컨볼루션 신경망(CNN)은 224x224, 256x256 등 특정 크기의 이미지에 대해 사전 훈련되어 있습니다. ResNet34의 경우 표준 입력 크기는 224x224입니다.성능: 이미지 크기를 늘리면 일반적으로 모델이 더 많은 세부 정보를 학습할 수 있지만, 계산 비용과 메모리 요구량도 증가합니다. 큰 이미지는 더 정밀한 패턴을 포착할 수 있지만, 학습 시간이 길어지고 더 많은 GPU 메모리를 필요로 합니다.데이터셋: 사용하는 데이터셋의 원..
딥러닝에서 ResNet34와 같은 모델을 사용할 때 예측 결과가 사람마다 다르게 나오는 이유는 몇 가지 요인에 의해 영향을 받을 수 있습니다. 모델의 동작을 완전히 일정하게 하려면 여러 요소들에 대한 고려가 필요합니다.난수 초기화(seed): 시드(seed)를 고정했다고 하셨지만, 시드는 라이브러리 및 실행 환경에 따라 다르게 적용될 수 있습니다. PyTorch, TensorFlow 등 사용하는 딥러닝 프레임워크에 따라 GPU 연산이나 다른 내부 알고리즘에서 난수를 다루는 방식이 달라질 수 있습니다. 또한, 시드 고정은 해당 프레임워크 내에서만 유효할 수 있으며, OS나 하드웨어 레벨에서의 랜덤성에 대해 제어할 수 없습니다.하드웨어 차이: 사용하는 하드웨어(특히 GPU)에 따라 결과가 달라질 수 있습니다..

01 모델 성능 높이는 방법1.1 모델 성능 높이는 방법 모델 학습 목표와 데이터, GPU 환경에 따라 적절한 모델 구조와 학습 전략을 선택해야 함● Ex 01) Task 마다 다른 모델 구조● Ex 02) 데이터 양에 따른 transformer-based, CNN-based model 선택○ 일반적으로 데이터가 적을 때 CNN-based model 유리함● Ex 03) Overfitting 방지를 위한 학습 scheduling 방법 조절 (lr, scheduler, steps, epochs, …) Pipeline학습된 모델의 피드백을 기반으로 성능을 개선하는 pipeline의 반복 작업을 통해 최적의 성능 도출1. 데이터: EDA, Augmentation, Pseudo labeling …2. 모델: H..
Image Segmentation과 Selective Search는 이미지 분석에서 서로 다른 목적과 기술적 접근법을 가지고 있습니다. 각각의 방법은 객체를 식별하고 이미지 내에서 특정 구조를 분리하는 데 사용되지만, 그들이 해결하려는 문제와 이를 처리하는 방식에 있어서 차이가 있습니다.Image Segmentation목적: 이미지 세그멘테이션은 이미지 내의 모든 픽셀을 하나 이상의 카테고리로 분류하여, 이미지의 더 세밀한 구조를 이해하고자 합니다. 이는 이미지 내 개별 객체의 정확한 위치와 경계를 파악하는 데 중점을 둡니다.기술적 접근:Semantic Segmentation은 클래스별로 픽셀을 분류하여 같은 클래스의 모든 객체를 동일하게 처리합니다.Instance Segmentation은 같은 클래스 ..
이미지 세그멘테이션(Image Segmentation)은 컴퓨터 비전 분야에서 매우 중요한 작업 중 하나로, 이미지를 여러 개의 구분된 부분(세그먼트)으로 나누는 과정입니다. 이 기술은 이미지 내의 각 픽셀을 하나 이상의 카테고리로 분류하여, 이미지의 더 세밀한 이해를 가능하게 합니다.이미지 세그멘테이션의 주요 유형:Semantic Segmentation:이 방법은 이미지 내의 모든 픽셀을 특정 클래스에 할당합니다. 같은 클래스에 속하는 픽셀들은 같은 레이블을 받지만, 객체 인스턴스는 구분하지 않습니다. 예를 들어, 여러 대의 자동차가 이미지에 있더라도 모든 자동차는 단순히 '자동차' 레이블로 표시됩니다.Instance Segmentation:이 기법은 semantic segmentation을 한 단계 ..
Selective Search는 주로 객체 인식(object detection)과 관련된 컴퓨터 비전 작업에서 사용됩니다. 이 기법은 이미지 내에서 객체가 존재할 법한 영역을 효율적으로 추출하는 데 초점을 맞춥니다. 여기에는 몇 가지 주요 사용 사례가 있습니다:객체 인식 시스템 초기 단계에서의 사용:Selective Search는 이미지에서 다양한 크기와 형태의 객체를 찾기 위해 사용됩니다. 예를 들어, 이미지에서 색상, 질감, 크기, 모양 등을 기반으로 하여 의미 있는 영역을 구분하고, 이러한 영역을 통합하여 후보 객체 경계 상자를 생성합니다.Region Proposal Method:많은 전통적인 객체 탐지 알고리즘(예: R-CNN 계열)에서는 딥러닝 모델이 객체를 인식하기 전에, Selective S..
Attention 메커니즘은 인공지능, 특히 자연어 처리(NLP)와 컴퓨터 비전 분야에서 중요한 기술로, 모델이 입력 데이터 중에서 어떤 부분에 중점을 두어야 하는지를 학습하는 데 도움을 줍니다. 이 기술은 특히 번역, 요약, 이미지 캡셔닝 및 질의 응답 시스템에서 유용하게 사용됩니다.Attention의 기본 원리Attention 메커니즘의 핵심 아이디어는 입력 시퀀스(단어, 이미지의 픽셀 등)의 각 요소에 가중치를 할당하여, 모델이 특정 부분에 "집중"하도록 만드는 것입니다. 이 가중치는 데이터의 중요도를 나타내며, 모델이 출력을 생성할 때 이러한 중요도를 참고합니다.Attention의 동작 방식점수 계산(Score Calculation): 입력 데이터의 각 요소가 현재 처리 중인 작업에 얼마나 중요한..
- Total
- Today
- Yesterday
- Transformer
- Python
- 파이썬
- #패스트캠퍼스 #UpstageAILab #Upstage #부트캠프 #AI #데이터분석 #데이터사이언스 #무료교육 #국비지원 #국비지원취업 #데이터분석취업 등
- Lora
- nlp
- LIST
- #패스트캠퍼스 #패스트캠퍼스ai부트캠프 #업스테이지패스트캠퍼스 #upstageailab#국비지원 #패스트캠퍼스업스테이지에이아이랩#패스트캠퍼스업스테이지부트캠프
- Hugging Face
- RAG
- speaking
- 코딩테스트
- recursion #재귀 #자료구조 # 알고리즘
- git
- Numpy
- clustering
- PEFT
- cnn
- Github
- 리스트
- 손실함수
- English
- LLM
- #패스트캠퍼스 #패스트캠퍼스AI부트캠프 #업스테이지패스트캠퍼스 #UpstageAILab#국비지원 #패스트캠퍼스업스테이지에이아이랩#패스트캠퍼스업스테이지부트캠프
- Array
- t5
- 해시
- 티스토리챌린지
- 오블완
- classification
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |