본문 바로가기

연구노트

(11)
[AI/WSL] WSL2 환경에서 Pix2Pix 사용할려다 징징대는 글 결론부터 말하자면 망할 황가놈이 일을 안해서 몬쓴다 see-ro-e.tistory.com/306 [AI] 신비한 캬루콘 생성기 (feat. 뒤틀린 황천의 캬루콘) 인터넷을 하다보면 댓글에 다음과 같은 이상하게 귀엽게 생긴 캐릭터가 짤로 자주 나온다. 해외에서 밈으로써 쓰이는 "우는 고양이"나 " Woman Yelling at a Cat" 을 기반으로 프리코네라는 게임의 등 see-ro-e.tistory.com 위 포스팅을 작성하던중에 그림작가님께서 트위터에는 원본 이미지를 같이 올린다는걸 알게됬는데 그래서 Pix2Pix 로 머신러닝을 돌려보고자 했다. github.com/phillipi/pix2pix phillipi/pix2pix Image-to-image translation with condition..
[AI] 신비한 캬루콘 생성기 (feat. 뒤틀린 황천의 캬루콘) 인터넷을 하다보면 댓글에 다음과 같은 이상하게 귀엽게 생긴 캐릭터가 짤로 자주 나온다. 해외에서 밈으로써 쓰이는 "우는 고양이"나 " Woman Yelling at a Cat" 을 기반으로 프리코네라는 게임의 등장하는 주인공 "캬루" 로 한국인 작가 [pixiv 링크]분께서 다시 그린것이다. 일명 "신비한 캬루콘" 이라고 불린다. 보다 자세한 설명은 킹무갓키를 참고하기 바란다. 저 캐릭터가 어떤 캐릭터인지는 중요한게 아니고 암튼나무위키에 보면 "신비한 캬루콘 모음들과 원본 사진들" 링크가 있는데 이걸보고 내가 든 생각중에 하나는"야 이 정도면 머신러닝 돌려도 되겠는데?" 안타깝게도 필자는 컴퓨터 엔지니어지 머신러닝 리서처는 아니므로, AI 에 관하여 잘아는 후배에게 물어봤다 쌉가능하다는 말을듣고 바로 머..
플러그인 필요없는 크로스 브라우저간 통신 Webrtc 예전에 Webrtc 관련한 일을 할뻔했는데.. 여러가지 사정상 하지는 않았다. 그때 처음 봤던 기술이었는데 최근에 친구들과 보드게임을 하면서 "이거 그냥 프로그래밍해서 우리끼리 쓸수있지 않을까?" 라는 말이 나와서 시간이 나면 한번 만들어 보려고 다시 찾아보고있다. 플러그인 없고 크로스 웹 브라우저간에도 통신이 된다는점에서 (심지어 네이티브까지) 아주 강력하고 유용하다. P2P 기반이기는 하지만 네트워크 주소를 얻기위한 STUN 서버와 P2P 연결 실패 했을 경우를 위한 TURN 서버가 필요하다 근데뭐 그냥 지인들끼리 보드게임용으로 쓰는경우 (같은 네트워크에서 카드만 분배해주면 되니까..) 에는 필요없을꺼 같다. 원래 음성채팅기능을 만들기 위해서 Audio 챕터에 넣었었는데 생각해보니까 Audio 한정이..
JVET 표준화 활동 보고회 Loop filter ALF: Luma 7 line/ Chroma 4 line을 사용했는데 Virtual Boundary를 사용해서 ALF 라인 버퍼를 제거 è Virtual Boundary부분은 패딩,트렁케이티드함 Non linear ALF: 현재 샘플과 주변샘플간의 차를 구하고 clip을 하여 non linear형태로 만듬 CTU adaptive ALF : 하나의 필터셋을 TIle에서 공유했는데 이를 CTU별로 서로다른 필터셋을 사용하도록 Deblocking filter : bug fix LMCS (Luma mapping and chroma scaling) : simplification and clean up High Level Syntax HLS관련 27개 채택됨 Decoder parameter s..
VTM yuv player 역시 사람은 물건을 사든 프로그램을 받은 도큐먼트를 읽어야한다. 2.0에서 바로 3.0 으로 넘어와서 VTM 3.0에서부터 써있는건지 그 사이에 있는건지는 모르지만 https://github.com/IENT/YUView오픈소스 VTM 비주얼 라이져 에 관한 설명이 있다. 3.0 받자마자 확인했는데 올려놓는것을 깜빡.. 짱좋다. 인트라 디렉션이 화살표나 번호가 아니라(확대하면 번호이긴하지만) 색상이라 지금 하는거에서 구분하기 힘들기는한데뭐 오픈소스니까 정 안되면 수정하면 될듯하디. bin파일을 분석하는것이아니기떄문에 yuv파일과 디코더에서 DTrace 를 이용하여 .vtmbmsstat인가 암튼 이거 출력하게 해서 같이 읽어서 overload하는 방식으로 사용한다.자세한것은 VTM 다운받으면 도큐먼트에 친절..
JVET 표준화 활동 보고회 VVC Standardization Activity Summary BMS 는 2까지, 이제 VTM 만 Profile level에서 tool on/off Slice -> Tile group header 방식 SAO 일단 다시 추가 (Working Draft 3에) ALF 라인 버퍼 이슈를 제외하고 대부분 클리어 11.23 Draft3 12.14 Algorithm description VVC Adoptions of Partitioning, Intra, High Level Syntax Partitioning: 1. QT/BT/TT Constraint 가 궁합이 별로라 이걸 수정함. 현재는 SPS 에서 시그널링 , 현재 애메모호한 시그널링을 미연에 방지하고자함 2. Virtual pipeline data uni..
[2018 Summer School 정리] Combined prediction & CPR 2018/08/30 - [연구노트/VVC] - [2018 Summer School 정리] VVC 표준화 동향2018/08/30 - [연구노트/VVC] - [2018 Summer School 정리] Picture Partitioning Structure2018/08/30 - [연구노트/VVC] - [2018 Summer School 정리] Intra Prediction Coding in VVC2018/08/30 - [연구노트/VVC] - [2018 Summer School 정리] Inter Prediction Coding in VVC Combined Prediction 1. Multi hypothesis: bi이상의 MV 사용 2. MAP: Merge assistant prediction :extra me..
[2018 Summer School 정리] Inter Prediction Coding in VVC 2018/08/30 - [연구노트/VVC] - [2018 Summer School 정리] VVC 표준화 동향2018/08/30 - [연구노트/VVC] - [2018 Summer School 정리] Picture Partitioning Structure2018/08/30 - [연구노트/VVC] - [2018 Summer School 정리] Intra Prediction Coding in VVC Inter Prediction Coding in VVC Affine 1. Affine: 모션 벡터 2개를 이용, 내부는 리니어 모델로 채워줌 4para: 4para로 6para 추정 (찌그러진 모션은 허용하지않음) 내부는 서브블록으로 나누고 서브블록의 MV를 생성 2. Affine nomal/skip/merge/am..