전체 글
-
[COMMA : 시각·청각 장애인을 위한 인공지능 기반 학습 보조 프로그램 ] Open AI 의 GPT-4o를 사용하여 대체텍스트 생성하기카테고리 없음 2024. 11. 21. 19:47
COMMA는 시각장애인을 위해 강의 자료를 텍스트로 변환하는 대체텍스트 생성 기능을 제공합니다. 이 기능을 활용하면 강의 자료의 시각적 요소를 분석하고 텍스트로 변환하여 사용자에게 적합한 학습 환경을 제공합니다. 이번 튜토리얼에서는 COMMA의 대체텍스트 생성 기능을 사용하여 Dart와 Flutter로 jpg,pdf 파일을 업로드하면 대체텍스트를 자동 생성하여 출력해보겠습니다. ※ 대체텍스트 : 시각장애인의 웹 접근성을 위한 대표적인 방법으로, 이미지 형태의 정보를 시각장애인이 이해할 수 있도록 풀어 설명해 주는 설명이나 문구. 0. 개발 환경이 튜토리얼의 코드는 모두 Flutter 3.24.3 및 Dart 3.5.3 환경에서 작성되었으며, Flutter 3.8 이상과 Dart 3.5 이상에서 호환 가..
-
실시간 SST - 리턴제로 api 를 통해서 실시간으로 음성을 텍스트로 변환하기카테고리 없음 2024. 5. 28. 23:46
진행하고 있는 프로젝트에서는 실시간 SST 기술이 필요합니다. 하지만 현재 오픈 소스로 사용하고 있는 SST기술은 실시간이 아닌 파일을 업로드하여 텍스트로 변환하는 프로그램이 대부분입니다.흔히 쓰는 SST API 기술 중에는 구글과 클로바 speech도 모두 실시간성이 아닌 파일을 업로드하거나녹음을 끝내야 텍스트로 변환이 시작됩니다. 이와 다르게 리턴제로 음성인식 API는 실시간 텍스트 변환을 제공합니다. 음성파일을 약 2초 간격으로 쪼개면서 텍스트를 변환하여 실시간처럼 텍스트를 제공합니다. 이번 프로젝트에서 실시간성이라는 조건에 적합한 SST기술을 리턴제로 음성인식 API 를 사용하여 실시간으로 텍스트로 변환하는 프로그램을 진행해 보려고 합니다. 스트리밍 STT의 방식에는 gRPC와 We..
-
[혼자 공부하는 머신러닝 + 딥러닝] 7장 딥러닝카테고리 없음 2023. 11. 25. 23:36
딥러닝 패션 MINIST 데이터셋 사용 몇개의 샘플을 그림으로 출력하여 이미지 확인 unique() 함수 : 레이블당 샘플 개수 확인 로지스틱 회귀로 패션 아이템 분류하기 훈련샘플이 60,000개나 되기 때문에 전체 데이터를 한꺼번에 사용하여 모델을 훈련하는 것보다 샘플을 하나씩 꺼내서 모델을 훈련하는 것이 효율적 => 확률적 경사 하강법 SGDClassifier 클래스의 loss 매개변수를 'log'로 지정하여 로지스틱 손실 함수를 최소화하는 확률적 경사 하강법 모델을 만들기 확률적 경사하강법은 표준화 전처리된 데이터를 사용 이유) 특성마다 값의 범위가 많이 다르면 올바르게 손실 함수의 경사를 내려올수 없기 때문 reshape() 메서드: 2차원배열을 1차원배열로 펼치기 SGDClassifier & c..
-
[혼자 공부하는 머신러닝 + 딥러닝] 06장 비지도 학습카테고리 없음 2023. 11. 18. 00:03
06-1 군집 알고리즘 타깃을 모르는 비지도 학습 비지도 학습: 타깃이 없을 때 사용하는 머신러닝 알고리즘이 있다 넘파이에서 npy 파일 로드하기 load() : 메서드에 파일 이름을 전달 넘파이 배열로 저장된 이미지 쉽게 그리기 : 맷플롯립의 imshow() 함수 사용 imshow() : 흑백이미지로 cmap 매개변수를 gray로 지정 / gray_r로 지정하여 다시 반전하여 눈에 보기 좋게 출력 subplots() 함수: 여러개의 그래프를 배열처럼 쌓게 도와줌 /함수의 두 매개변수는 그래프를 쌓을 행과 열을 지정 픽셀값 분석하기 샘플의 픽셀 평균값 계산 mean() : 픽셀의 평균값을 계산하기 hist(): 히스토그램 그리기 / alpha 매개변수를 1보다 작게 하면 투명도를 줄수 있음 legend(..
-
[혼자 공부하는 머신러닝 + 딥러닝] 5장 트리 알고리즘카테고리 없음 2023. 11. 11. 15:42
테스트 세트를 적게 사용하기 과대적합인지 과소적합인지 판단하기 위해서 테스트세트를 사용하지 않고 훈련세트를 사용하기 => 검증세트 사이킷런에서 제공 wine = pd.read_csv('https://bit.ly/wine_csv_data') data = wine[['alcohol', 'sugar', 'pH']].to_numpy() target = wine['class'].to_numpy() from sklearn.model_selection import train_test_split train_input, test_input, train_target, test_target = train_test_split( data, target, test_size=0.2, random_state=42) sub_input..
-
[혼자 공부하는 머신러닝+딥러닝] 03-1 k-최근접 이웃 회귀카테고리 없음 2023. 11. 4. 22:36
03-1 k-최근접 이웃 회귀 예측하려는 샘플에 가장 가까운 샘플 k개를 선택 이 샘플들의 클래스를 확인하여 다수 클래스를 새로운 샘플의 클래스로 예측 ex) 샘플 x의 가장 가까운 샘플 3개를 선택=>2개 네모 1개 세모 => 샘플 x의 클래스는 네모 문제 : 농어의 길이 높이 두께 측정 데이터를 통해 무게 예측하기 해결 : k- 최근접 이웃회귀를 통해 머신러닝 만들기 데이터 준비 사이킷런의 train_test_split() 함수를 사용해 훈련세트와 테스트 세트로 나누기 from sklearn.model_selection import train_test_split train_input, test_input, train_target, test_target = train_test_split( perch_l..
-
혼자 공부하는 데이터분석 with 파이썬 06-1 복잡한 데이터 표현하기카테고리 없음 2023. 10. 7. 23:09
pyplot 방식으로 그래프 그리기 plt.plot([1, 4, 9, 16]) plt.title('simple line graph') plt.show() 객체지향 API 방식으로 그래프 그리기 피겨 객체와 Axes 객체를 사용하는 객체지향 API 방식으로 그림 fig, ax = plt.subplots() ax.plot([1, 4, 9, 16]) ax.set_title('simple line graph') fig.show() 폰트 지정하기1:font.family속성 기본 폰트 : 영문 sans-serif plt.rcParams['font.family'] 나눔고딕으로 변경 plt.rcParams['font.family'] = 'NanumGothic' 폰트 지정하기2: rc()함수 plt.rc('font', ..
-
혼자 공부하는 데이터분석 with 파이썬 05-2 선 그래프와 막대 그래프 그리기카테고리 없음 2023. 9. 30. 21:48
연도별 발행 도서 개수 구하기 value_counts() 메서드 : 첫번째 열이 인덱스이고 두번째 열이 값에 해당 : 기본적으로 값을 기준으로 내림차순 count_by_year = ns_book7['발행년도'].value_counts() sort_index() 메서드 : 인덱스 기준으로 오름차순 정렬 count_by_year = count_by_year.sort_index() count_by_year 주제별 도서 개수 구하기 value_counts() 함수 count_bt_subject = ns_book7['주제분류번호'].value_counts() 선 그래프 그리기 : 맷플롯립의 plot() 함수는 선그래프 plt.plot(count_by_year.index, count_by_year.values) p..