본문 바로가기

AI

(21)
[Yolov10] Custom Data 실습 코드 실습 중 경량화된 Object Detection 모델이 필요했고, Yolov10 nano를 학습해보기로 했음 #1.  Yolov10 Git clone & 가상환경 세팅경로 : /home/project/yolov10https://github.com/THU-MIG/yolov10 GitHub - THU-MIG/yolov10: YOLOv10: Real-Time End-to-End Object Detection [NeurIPS 2024]YOLOv10: Real-Time End-to-End Object Detection [NeurIPS 2024] - GitHub - THU-MIG/yolov10: YOLOv10: Real-Time End-to-End Object Detection [NeurIPS 2024]github..
[Vision Transformer(ViT)] 코드 설명 및 인자 정리 [Vit 를 사용한 코드 구현 중 인자 정리 및 개념 정리] 참고 코드 : https://github.com/lucidrains/vit-pytorch/blob/main/vit_pytorch/vit.py vit-pytorch/vit_pytorch/vit.py at main · lucidrains/vit-pytorchImplementation of Vision Transformer, a simple way to achieve SOTA in vision classification with only a single transformer encoder, in Pytorch - lucidrains/vit-pytorchgithub.com class Transformer(nn.Module): def __init_..
[Active Learning] 데이터 Pre-training, 학습 진행 동양인 데이터로 Pre-training된 모델로 Active Learning 진행 pre-training모델은 찾을 예정 데이터셋은 추가 수집 예정 우리 데이터셋을 보완해 Active Learning 진행 Pre-trained datasetCategory: female, Age group: 0, Number of images: 20 Category: female, Age group: 10, Number of images: 12799 Category: female, Age group: 20, Number of images: 38118 Category: female, Age group: 30, Number of images: 11162 Category: female, Age group: 40, Number ..
[OpenCV 오류] module 'cv2' has no attribute 'createThinPlateSplineShapeTransformer' 오류 발생 pip uninstall opencv-contrib-python pip install opencv-contrib-python 설치 직후에도 같은 오류가 발생했으나 VSCODE 종류 후 재실행 ▶ 성공함! +) 인터넷에 나와있는 모든 방법을 사용했도 오류 해결이 안되었는데 서버 종류 후 재접속하니깐 바로 성공했다 ㅠㅠ...
[머신러닝 프로젝트] LOL 경기 예측 1. 프로젝트 동기 이번 롤드컵에서 한국팀 'T1'이 우승하였고 게임을 진행하는 동안 수많은 감독과 코치진, 다양한 전략이 필요하다는 것을 알게 되었음. 경기에 대한 여러 분석 영상을 보다가 'lol'게임과 관련한 데이터셋을 다뤄보고 싶다고 생각함. 게임 중 여러 특징들을 가지고 블루 팀의 '평균 레벨 값'을 예측하는 회귀 모델과, 블루 팀의 '승패'를 예측하는 분류 모델을 만들어보고자 함. 2. 데이터셋 소개 LOL: League of Legends Diamond Ranked Games (10 min) https://www.kaggle.com/datasets/bobbyscience/league-of-legends-diamond-ranked-games-10-min League of Legends Diam..
[논문리뷰] U-Net: Convolutional Networks for Biomedical Image Segmentation 1. Introduction 초기 컨볼루션 신경망은 훈련 데이터셋의 부족과 모델의 크기 제한으로 인해 성능이 제한되었음 ImageNet 데이터 세트에서 8개의 레이어 등 대규모 네트워크를 지도 학습하며 더 크고 심층적인 네트워크가 훈련됨 일반적인 사용 : 단일 클래스인 분류 작업 Biomedical task에서는 localization( 분할된 각 픽셀에 클래스 라벨이 할당됨 )을 필요로함 sliding-window setup을 사용해 픽셀 주위에 로컬 영역(patch)을 제공함 장점 1. localize가 가능함. 2. patch의 관점에서 훈련 데이터는 훈련 이미지의 수보다 훨씬 큼. ( 이미지의 다양한 부분을 다양한 패치로 나누어 훈련 데이터를 확장) 단점 1. patch마다 네트워크 별도로 실행 ..
[실전! 컴퓨터 비전을 위한 머신러닝] 06. 전처리 전처리를 하는 이유 모양 변환, 데이터 품질 변환, 모델 품질 향상 등의 이유 모양 변환 tf.keras.layers.Flatten(input_shape =(512,256,3)) 모든 레이어는 생성 당시에 정한 명세에 맞는 이미지를 필요로함 512*256*3=393,216개의 입력 노드를 갖도록 만들어짐 데이터 품질 개선 햇빛이 비치는곳 / 그렇지 않은 곳 = > 밝기에 차이 생김 지구 상의 지점에 비치는 햇빛을 고려해 각 픽셀값을 정규화 할 수 있음 모델 품질 향상 픽셀값 조정, 데이터셋 증강 크기와 해상도 5장의 꽃 이미지 사용 이미지 크기가 제각각임 케라스 전처리 레이어 사용 입력레이어에서 예상하는 모양에 맞게 바꾸는 전처리를 진행해야 함 img = tf.image.resize(img, [IMG_H..
[실전! 컴퓨터 비전을 위한 머신러닝] 04 객체 검출과 이미지 세분화 객체 검출 이미지에서 위치 정보를 제공하는 과업 YOLO YOLO 격자 그림은 N x M 칸으로 분할 셀 내부 어딘가에 중심점을 갖는 객체에 대한 경계 박스를 예측함 객체 검출 헤드 숫자 6개 예측 - 경계 박스의 좌표 4개, 객체가 검출됐는지를 나타내는 확신도, 객체의 클래스 너비와 높이는 [0,1] 범위에 속하도록 시그모이드 활성화 사용 확신도 C도 [0,1] 범위에 있으므로 소프트맥스 활성화 사용 Q. 올바른 차원의 특징 맵을 얻는 방법에는? A. 컨볼루션 백본에서 반환되는 특징 맵을 모두 평탄화해서 출력 개수와 같은 수의 완전 연결 레이어에 먹이는 것 손실 함수 훈련 데이터 내에 정답 - 실측 박스 (ground truth box) 예측 박스 (predicted box) 실측 박스와 결자 셀 내의..