- 3개의 track 으로 나뉘며 나는 3번째, AI Research 만 봤다
INDEX
- 추가해야 함 ㅇㅇ
1. 공간지능 (Spatial AI) 가 미래입니다
- 연사자: 장형기 - SLAM KR
- 늦게 도착해서 뒷부분 10분밖에 못 들었음
- slam
- spatial ai
- 공간을 지배, 메타버스 - 현실과의 경계를 무너뜨리는
2. 금융분야 AI 적용 방향
- 연사자: 유주현 - 모두연 DAT LAB
- 정형 데이터 분석만 이뤄졌던 financial 분야에서 최근 비정형 데이터를 많이 다루기 시작
- 상장기업만 2500개 - 금감원에서 다 볼 수 없음. audit을 자연어처리로 하려는 시도
- 기업 esg 평가 - 지속가능보고서, 뉴스 모니터링
- 개인 SNS 분석을 통해 신용 평가 강화
- 위성 사진 분석, 원유나 밀 등의 선물을 미리 포착하고 투자 결정
- 가치투자, 성장주투자. asset analyzer
- 마켓타이밍, 감성분석
- asset allocator - 분산투자. 채권, 원자재, 선물 비율 조절
- macro analyzer
- 경기 예측. 금리, cpi
- baby step
- top-down 방식, 개인 혹은 가치투자자가 사용하긴 어려움
- 모든 증권사가 리서치 센터에서 이런 일들을 하고 있음
- 이전엔 퀀트적인 접근 - 통계나 수학적 모델(블랙 숄즈 등) 했는데 이제는 머신러닝을 기반으로
- MTD - Market Timing Detector - 모멘텀 포착 엔진
- 비교적 짧은 기간에 대한 추세에 대한 모델을 통해 전 종목의 데이터를 통합할 수 있을 것이라 가정
- 112개의 feature
- 전처리 후 Feature selection - permutation, MDI, RFECV
- ISA - Invest Sentimental Analyzer
- 감성분석
- 금융 특화 딥러닝 언어모델
- kakao 와 협업?
- 선물이 present 가 아닌 futures 로 해석되게, 금융 특화 말뭉치
- KoELECTRA, DeBERTa
- NER 로 종목 태깅
- 르네상스테크놀로지 해지펀드
- 안정적인수익
- long short를 같이
3. Federated Self-Supervised Learning 으로 비정상 폐음 분류하기
- 모두연 - papershop
- 의료데이터 특징
- 개인정보보호법, 의료법
- 데이터 부족, label 부재
- labeling 어려움
- 비용
- 청진기 데이터 문제
- 청진음 데이터 수집 사례 x
- 기존 의료영상은 데이터가 남지만 청진음은 휘발됨
- class imabalence
- 스크리닝에서 청진은 안 하고 지나가는 경우가 많음
- 천명음: 기도암, 기관협착증 의심
- 수포음: 흡기 시의 소리. 마찰음과 비슷해 구별하기 어려움. 심부전, 폐질환 의심
- SSL
- high-level feature. downstream task 좋은 성능
- pretext tasks
- constrative learning
- masked autoencoder
- high-level feature. downstream task 좋은 성능
- constrative learning
- simclr
- federated learning
- local update -> aggregate
- 풀고자 하는 문제: 각 lodcal data 의 heterogeneity 를 어떻게 고려해 aggregate 하고 모델을 update 할 것인가
- constrative learning에닌 aug가필수임 - why?
- novel ssl task (Spectogram augmentation) + heterogeneous lung sound aggregation
4. 모두연의 블랙스완, 사회과학 연구 해보기
- 연사자: 최화준 - 모두연 TSJ LAB
- 블랙스완, 사회과학 연구
- 사회과학이란
- 인간관계 추론. 사람 사는 이야기
- 가장 재밌는건, 칭찬보단 험담, 욕과 비속어
- 정의란무엇인가 - 민식이법, 대통령
- 사회적 정의와 법적 정의에서 얼마나 차이가 날까
- 한문철tv
- 사람들이 판결에 동의하는가
- 댓글을 감성분석 -> 동의의 여부를 알 수 있음. 주어 중심
- 메뉴얼로분석?
- 교통사고가 3심을 가는 사례는 없다고 함
- 사회과학은 ai와는좀다르다.
- 모두연의 paper lab?
- 끝까지 하면 공동저자
- 경험과 책임감을 가진 사람이 지도해야
5. N행시를 지어주는 트위터봇
- 연사자: 예두해
- 3시간에 한번씩 자동트윗
- 튜니브릿지 - n행시 지어주는 api
- 트래픽 급중. 디도스로 의심할 정도
- api 가 아니라 서비스로
- tweepy
- 리트윗, 답글? 댓글? 인용?
- fastapi
- 운영자가 직접 트윗을 작성하면 자동화됨 태그가 사려져서 서비스에 대한 환상이 깨질 수 있다
- 그래서 트위터 api 를 쓰기 위해 사용
- postgreSQL
- user 정보, 리트윗 정보, 메인 트윗 정보, 폰트 및 기본 템플릿 정보, 로그 정보
- pillow
- n행시 이미지 생성
- aps 스케쥴러
- 3시간마다 메인트윗, 13초마다 멘션된 트윗 정보, 40초마다 멘션한 유저의 n행시 작성
- 폰트 깨지는건 db에서 해당 폰트 못 쓰게 해서 해결함
- 윤리모델은 안 넣었음
6. 음악으로 인사이드 아웃: 당신의 감정을 아는 음악 추천 시스템
- 연사자: 김도현 외 1인 - 아이펠 수료
- 원래 ‘내가 뭐라고 했더라’ 발표였는데, 발표자가 불참해서 대체됨
- streamlit 으로 서비스
- 7458개로 데이터를 잘랐음 - class imbalance
- gcp 는 비싸다, trc 에서 포트를 받으면 무료 tpu 사용 가능
- 음악추천 차별점
- 유저의 인풋으로 콜드스타트를 해결하겠다
- user 의 피드백으로 추가 학습?
- Mel spectrogram 이 완벽하지는 않음. 노이즈처럼 작용하기도 함
- 스포티파이는 고도의 연구를 많이 함
7. 당신 개발자 맞아?
- 연사자: 장혜선, 최정인 - 아이펠 수료
- 아이펠, 스마트사운드 프로젝트
- 바로취업
- 밑딥3
- 스펙트로그램
- 기업프로젝트 - 소리데이터
- 논문구현
- 심장음 - 쿵-쾅 사이, 지속적인 잡음
- smartsound
- 음성처리. 헬스케어
- skeeper
- 동물용 무선 청진기
- stethoscope - skeeper r1
8. 현대적인 추천 시스템 구축을 위한 여정
- 연사자: 허훈 - Liner
- go는 추천 구현할 때 참 좋다. MSA
- done is better than perfect
- design docs. design choice
- b2c 사업에서 ml 의 적용은 일반적인 경우와 사뭇 다르다
- 발표자료가 공유되어 있음
9. 후기
- 팝콘도 주고 도시락도 줬다. 분명 무료였던 거 같은데
- done is better than perfect 라는 말이 인상적이었다
- 공부든, 일이든 뭘 하든지 마찬가지 같다
- 첫 술에 배부를 순 없다. 난 지금까지 비효율적으로 일을 해온 것 같다
- 공부를 좀 더 하다가 모두연에도 참여해보고 싶다
- 퀀트에 관심이 생겨서 공부해보려 한다
- 르네상스테크 같은 곳은 찾아보니 공대 박사급만 가는 듯..
- 수학이 기본이 되는 것 같다. 물리든 금융이든 딥러닝이든, 결국 수학이 기본이다
- 신경망을 이해하는 데에 높은 수준의 수학적 지식이 필요한 것은 아니지만.. 수학을 알면 이해의 깊이가 달라지며 선택의 폭이 넓어지는 것 같다.
- 수학과 복전의 선택은 틀리지 않은 것 같다. 해봐야 알겠지만
- 백조교님을 뵀다. 사진도 찍었다
- 직접 죄송하다 말씀드리고 싶었는데.. 나는 너무 한심한 것 같다
- 그래도 괜찮다 해주셔서 다행이었다. 넘 착하신 것 같다..
- 시간이 애매해서 그냥 바로 집에 갔다. 눈이 와서 미끄러웠다
- 연세대는 정말 컸다
first draft: 2022.12.16 11:09