[2023] / [4인 팀프로젝트] Music Transcription from Silent Videos
·
Project
1. Introduction 온라인 영상을 보고 동일한 곡을 연주하고 싶으나 악보가 없으면 연주하기에 많은 어려움이 있습니다. 기존에 존재하는 악보 생성 모델들은 소리를 기반으로 생성하며, 이는 노이즈가 있거나 다른 악기와 함께 녹음된 경우 사용할 수 없다는 단점이 존재합니다. 따라서 본 프로젝트에서는 이를 해결하기 위해 시각 정보만으로 악보 및 음악 파일을 생성하는 서비스를 개발하였습니다. 2. 개발 배경 및 필요성 온라인 영상을 보고 동일한 곡을 연주하고 싶으나 악보가 없어 연주하기 어려움이 있음 기존 악보 생성 모델들은 음원에 노이즈가 많거나 여러 악기가 함께 녹음된 경우 사용할 수 없다는 단점이 존재 3. 사용된 모델 reference : Audeo: Audio Generation for a Si..
[2022] / [4인 팀프로젝트] 개인 맞춤형 식단 관리
·
Project
1. Introduction 본 프로젝트에서는 규칙적인 식사, 균형 잡힌 영양소 섭취를 위해 사용자가 섭취한 식단 및 영양소를 수동으로 기록하는 기존의 시스템에서 인공지능 컴퓨터 비전(CV) 분야 중 객체 검출(Object Detection) 기술을 사용하여 사용자가 섭취한 식단의 영양소를 자동으로 인식해 확인하고 기록하는 APP을 개발하였습니다. 2. Tech Stacks Python Pytorch Flask Firebase Android Studio Socket YOLO 3. My Part Model Train (YOLO v5) YOLO v5 : AI-Hub "음식 이미지 및 영양정보 텍스트"를 목적에 맞게 전처리하여 학습 Instagram 음식 사진 Crawling \(\rightarrow\) AI..
[2022] Smoke Opacity가 모델에 미치는 영향
·
Project
위와 같은 이미지에 Bounding Box를 그리자면 대부분의 사람들은 이미지 전체를 덮도록 영역을 지정할 것이고 나또한 그럴 것이다. 이러한 이유는 연기의 불투명한 특성 때문에 배경과 구분할 수 있는 경계가 모호하기 때문이다. 이를 그대로 학습하게되면 모델이 연기를 예측할 때 연기의 특징 뿐만아니라 주변 배경도 함께 학습하게 된다. 이러한 근거는 다음 그림에서 확인할 수 있다. 오른쪽 그림에서 빨간색 부분이 연기로 인식한 부분인데 이와 근접한 노란색 부분이 배경 전체에 넓게 퍼져 있다는 것은 주변 모두 연기와 비슷할 것이라 예측하고있다. 이와 함께 앞서 진행한 프로젝트를 통해 연기의 불투명도가 모델이 연기를 검출하는 성능에 영향을 준다는 점을 직관적으로 확인할 수 있었다. \(\rightarrow\) ..
[2022] Fire & Smoke Object Detection
·
Project
1. Introduction 건조한 기후와 사람들의 작은 실수 하나로 거대한 산불이 일어났다는 뉴스를 많이들 듣습니다. 또한, 일상 생활이나 산업 시설 어디서든 화재 위험은 잠재되어 있지만 사람이 항상 그 위험을 주시하는 것은 어렵습니다. 이러한 화재는 초기에 빠르게 진압하지 않으면 돌이킬 수 없이 번져 이를 해결하는데 많은 인력과 비용이 소비됩니다. 본 프로젝트는 인공지능 컴퓨터 비전 분야의 Object Detection 기술을 사용하여 실시간으로 불 또는 연기를 검출할 수 있는 인공지능 모델을 설계하고 실사용이 가능한지 확인하는 것이 목표입니다. \(\rightarrow\) 인공지능 모델로는 실시간 검출에서 좋은 성능을 가진 YOLO 알고리즘을 선택하였습니다. 2. Tech Stack Python Y..
[2021] / [3인 팀프로젝트] 제품 리뷰를 분석하여 소비자에게 다양한 정보를 제공하는 모바일 웹 개발
·
Project
1. Introduction 백화점, 마트 등 다양한 장소에서 처음 보는 제품의 최저 가격, 장·단점, 사용 방법, 열량 정보, 다른 사람들의 평가 등 다양한 정보를 한 번에 알 수 있다면 얼마나 편리할까요? 본 프로젝트에서는 이러한 음식 제품의 정보를 모바일 웹에서 등록되어 있는 QR코드를 인식할 시 위와 같은 다양한 정보와 더불어 인공지능 자연어 처리(NLP) 기술 중 감성 분석(Sentiment Analysis) 기술을 사용하여 온라인 상에 등록되어 있는 제품의 리뷰를 분석하여 긍정적인 평가와 부정적인 평가의 비율을 수치화하여 제공하고, 대표적인 리뷰를 제공합니다. 2. Tech Stack Front-end HTML CSS JAVASCRIPT Back-end Python Node.js MySQL 3..
욱근욱
'Project' 카테고리의 글 목록