본문 바로가기

Computer83

레고처럼 넷트웍 모듈을 마음껏 쌓아 보자 lec 10-4 레고처럼 넷트웍 모듈을 마음껏 쌓아 보자 : https://youtu.be/YHsbHjTBx9Q 제목처럼 여러 형태로 조립해서 딥네트워크를 구성해볼 수 있다는 내용이다. - feedforword neural network : 쭉쭉 위로 쌓는 형태 - fast forword : 중간 출력을 몇단을 건너띄고 연결하는 형태 - convolutional nerual network : split & merge를 통해 network를 구성하는 형태 - recurrent nerual network : forword + 옆으로? 나가는 형태 이번 강의는 내가 글로 정리하는 것보다는 강의자료의 그림을 보고 이해하는 것이 좋을 것 같다. 강의 자료 : http://hunkim.github.io/ml/lec.. 2016. 6. 9.
Dropout & Ensemble 김성훈 교수님의 강의를 보면서 딥러닝을 공부중.정리를 하지 않고 보다 보니, 나중에 무얼 봤는지 조차 기억나지 않아서 간단히 블로그에 남긴다. lec10-3: Dropout 과 앙상블 : https://youtu.be/wTxMsp22llc overfitting : training dataset에 model이 fit된 상태 solution for overfitting- more training data- reduce the number of features (딥러닝에서는 상관없다고 함)- regularization 여기서는 regualarization에 대해서 좀 더 설명 cost + (lamda)(sigma) w^2 여기서 (lamda)를 regularization strength라고 한다.(lamda).. 2016. 6. 9.
논문 리뷰(한글 검색 질의어 오타 패턴 분석과 사용자 로그를 이용한 질의어 오타 교정 시스템 구축) 회사분이 추천해 준 논문인데, 배울 점이 많은 것 같다.수작업으로 만든 데이터와 기계적으로 추출한 데이터의 상관관계를 비교하는 부분이나,한국어 발음과 키보드간 거리를 결합하여 사용한 부분,연산비용을 계산하여 swap에 우선순위를 둔 부분 등이 마음에 든다. 논문한글 검색 질의어 오타 패턴 분석과 사용자 로그를 이용한 질의어 오타 교정 시스템 구축(전희원, 다니엘 홍, 임해창)http://www.slideshare.net/gogamza/ss-6265729요약가중치를 적용한 교정 거리 연산 사용베이지언 노이즈 채널 모델 + 한국어 특유의 속성 추가야후 로그에서 ed2까지의 데이터를 추출 후, 오타 -정타 쌍을 추출 후 계산ㅇㅑ후, 야후 의 keystroke 구분하기 위해 divider라는 개념 사용(d~i~.. 2016. 1. 11.
한글의 자모 분리 입력된 문자가 음절인지 확인하고, check_ch_type()음절인 경우 conv_jaso를 통해 자모 분해 & compatibility_jamo로 변환 import unicodedata def check_ch_type(ch): valid_type = ['Lo'] if unicodedata.category(ch) in valid_type: unicode_names = unicodedata.name(ch).split() if 'HANGUL' in unicode_names and 'SYLLABLE' in unicode_names: return True else: return False else: return False def conv_jaso(ch=u'각'): def conv_compatibility_jam.. 2015. 12. 3.