개발_이야기 41

KODI on apple tv generation 4

애플tv 를 구입하게되어 여러가지 활용하고 있다. tv os 의 앱으로 상당수 많은 서드파티들이 제공하고 있지 않기에 대부분의 사람들이 KODI 와 같은 앱을 통해 plugin ( addon ) 형태로 서비스를 이용하고 있다. apple tv 은 일반적인 tv os 보다 더 제한적인 환경 ( 저작권 ) 으로 KODI 를 확장하는 방법 또한 공식적으로 없다. apple tv 에 KODI matrix 를 설치하면서 겪은 troubleshooting 을 공유하고자 한다. 그나마 official 설치 문서 ( https://kodi.wiki/view/HOW-TO:Install_Kodi_on_Apple_TV_4_and_5_(HD_and_4K) ) 를 따라가면 설치과정에는 별 문제가 없다. 중간에 KODI deb ..

개발_이야기 2021.05.31

TTS

역사속의 많은 ml_tts 프로젝트를 진행하고 있음. 현재는 `multi-speaker-tacotron-tensorflow`를 실험하고 있는데 몇몇 느낀점들을 기술하려고함. 1. 학습에 cpu, gpu의 속도 차이가 3배 이상 남. 예를 들어 cpu는 step당 5.6초의 시간이 소요되므로.. 학습에 인고의 시간이 필요함`https://github.com/keicoon/multi-speaker-tacotron-tensorflow` repository에서 실험을 업데이트 하고 있음. 한국어 데이터셋(100+ hours)을 확보하고 있는데 어려움을 겪고 있음:cry: MSTT를 통해 원작자의 sample과 비슷한 퀄리티의 한국어 TTS의 결과물을 확보함.학습 과정에서 데이터 셋의 정확도가 높아야 결과물의 성..

texture_compression

1. original 텍스쳐와 decompression된 텍스쳐의 차이는 눈으로 봤을 때 크게 없음.2. PSNR과 SSIM으로 확인한 값은 꽤나 텍스쳐별로 변폭이 큼.3. baseline model외에 다른 idea를 접목한 기술을 실험하고 있어 기대가 큼. 그 외 `code`라는 중간 파일의 크기가 이 실험에서 중요한 압축률을 의미하는데 이 파일이 autoencoder의 중간 layer의 tensor 크기만으로는 너무 크므로 다시한번 bit단의 encoding이 필요함. 이 사실을 나중에 이해함.

PFNN(Phase-Functioned Neural Networks for Character Control)

PFNN(Phase-Functioned Neural Networks for Character Control) homepage : http://theorangeduck.com/page/phase-functioned-neural-networks-character-controlpaper : http://theorangeduck.com/media/uploads/other_stuff/phasefunction.pdfvideo : https://youtu.be/Ul0Gilv5wvYcode : https://github.com/sreyafrancis/PFNN PFNN은 real-time animtion finder이다. 수 많은 motion data 중에서 현재 가장 적합한 motion을 찾아주는 것이 핵심이다. so..

error: python3.6 ascii

jamo==0.4.0를 설치하는 과정에서 아래 에러 메세지가 발생함. UnicodeDecodeError: 'ascii' codec can't decode byte 0xe3 in position 701: ordinal not in range(128) env에 lang를 utf-8로 세팅해주면 해결됨. 아래는 관련 이슈 # http://bugs.python.org/issue19846# > At the moment, setting "LANG=C" on a Linux system *fundamentally breaks Python 3*, and that's not OK.ENV LANG C.UTF-8 이걸로 삽질 꽤나 함. 외국인들은 utf가 필요없으니까 안 쓰지만 한국어 관련 python lib를 사용하려면 설..

multi-speaker-tacotron-tensorflow DockerImage

mstt의 DockerImage를 만들기 위해 아래 작업을 진행함. 위 프로젝트는 아래의 의존성이 존재함 Python 3.6+FFmpegTensorflow 1.3 다른건 다 문제없지만 python 3.6 이게 은근히 까다로움;아직까지 배포된 도커이미지들은 python3.5가 default로 설치되어 있어서 재설치하기가 귀찮음. 기존의 nvidia에서 배포하는 cuda9.0_cudnn7에 아래 커맨드를 추가함 RUN apt-get update \ && apt-get install -y software-properties-common curl \ && add-apt-repository ppa:jonathonf/python-3.6 \ && apt-get remove -y software-properties-c..