Loading...

무슨 행사인가요?

DataBreak 2018

Data science를 쉽게 뽀개기 위한 오프라인 워크샵

DataBreak(데이터뽀개기)는 오프라인에서 국내 캐글러, 분석 실무자 등 데이터 분석에 관심있는 다양한 분야의 사람들 간 네트워킹할 수 있는 분석 워크샵입니다. 처음 라면을 끓이는 사람처럼 데이터 과학을 쉽게 입문(뽀갤 수) 할 수 있는 방법을 공유하고자 합니다.

2018년의 주제가 무엇인가요?

Hello Kaggler!

데이터 과학의 놀이터인 캐글을 알리고, 데이터 분석으로 가치를 낼 수 있는 인사이트를 이야기하는 자리

데이터뽀개기 2018년 행사 컨셉은 "Hello Kaggler!", 국내 캐글러가 모여서 캐글 경험기, 머신러닝, 탐색적 데이터 분석, 분석 자동화, 시각화 및 대시보드 등의 주제에서 데이터 분석으로 가치를 낼 수 있는 인사이트를 이야기하는 자리입니다.

"Hello World!"와 같이 가장 간단한 표현처럼 비전공자 또는 분석에 관심있는 학생/개발자들이 데이터 과학의 놀이터인 캐글 플랫폼을 통해 데이터 분석에 관심을 갖고 입문하길 바라는 마음입니다. '데이터뽀개기 2018'을 시작으로 매년 캐글뽀개기(KaggleBreak)와 함께 데이터를 뽀개 나가면 좋겠습니다.

speaker

김국진

DACON

#데이터사이언티스트

Gamer vs Data Scientist

능동적인 실행자로서 캐글 바라보기

speaker

황중원

위메프

#머신러닝 #딥러닝 #추천시스템

Building a Recommendation System in TensorFlow

Google Cloud에서 WALS알고리즘을 이용한 추천시스템 구축하기

speaker

이희재

펍지(PUBG)

#데이터시각화 #데이터모델링 #자동화

Interactive chart를 이용한 보고서 활용

정적인 그래프가 아닌 동적인 차트를 활용하여 분석보고서를 작성하는 내용을 공유합니다.

speaker

이상열

데이터뽀개기

#추천시스템 #운영자가취미 #게임회사 #InterpretableML

행사 소개

DataBreak 2018 행사 및 운영진 소개

speaker

정권우

Naver 파파고팀

#캐글 #독학

캐글을 위한 캐글

캐글을 처음 접하게되었을때에.. live 캐글 경진대회를 바로 뛰기에는 제가 한없이 부족했고 힘겨웠습니다. live 캐글에 도전하기 위해 시도했던 다양한 삽질들을 공유하고자 합니다.

speaker

박상원

DeepNatural

#딥러닝 #자연어처리 #대화형시스템 #챗봇

데이터 뽀갠 뒤 챗봇에 반영하기 (feat. BotHub.Studio)

영화 리뷰 데이터로 RNN 기반 감정분석기를 만들고 AWS Lambda로 API를 제작하여 챗봇에 적용해 봅니다.

speaker

이정윤

Microsoft

#머신러닝 #머신러닝컴피티션

[keynote] Mastering Machine Learning with Competitions

지난 8년간 80회 이상의 머신러닝 대회에 참가하고, 최근 KDD Cup과 마이크로소프트 OneML 대회를 운영한 생생한 경험을 나누고자 합니다. 머신러닝 대회의 역사와 현재, 유익과 오해, 그리고 머신러닝 대회에서 성공하기 위한 팁에 대해 다룰 예정입니다.

speaker

최동근

Saltlux

#ML #Semantic_web #Knowledge_base #Question_answering, #Time series analysis

QA에 사용되는 Knowledge Embedding 응용 및 활용 방안

KBQA(Knowledge Base Question Answering) 시스템에 사용되는 지식베이스의 확장 및 검증을 위한 지식임베딩 기술의 소개와 활용 방안에 대한 발표

speaker

여찬구

DEVSISTERS DSI (Data Science & Infrastructure

#데이터시각화 #데이터분석

기획자의 마음을 움직이는 데이터 시각화

모바일 게임 로그 데이터를 활용한 데이터 시각화를 통해 인사이트를 도출하고 의사결정에 반영한 사례를 공유합니다.

speaker

강규영

박스앤위스커

#데이터시각화

대한민국 인맥지도 (SPARQL, Python, D3JS, Network visualization)

대한민국 인맥지도는 정치인, 기업인, 방송연예인 등 위키데이터에 등재된 유명 인물들 사이의 지연, 학연, 혈연 등을 쉽게 살펴볼 수 있도록 도와주는 웹사이트입니다.

speaker

이광춘

Tidyverse Korea

#데이터과학 #기계학습 #통계학 #시각화 #데이터저널리즘

Tidyverse와 기계학습(ML)

데이터 랭글링, 분석, 시각화는 Tidyverse에 안착했지만, 기계학습에 대한 도전은 이제 시작입니다.

speaker

박준용

SK주식회사 C&C Data science 팀

#bigdata #deeplearning #데이터분석

R을 shiny하게 하는 shiny

Shiny를 활용한 R 분석 interactive 웹 시각화 방법 이해 및 빅데이터 실구축 사례 소개

speaker

유인제

조이코퍼레이션 분석팀

#데이터시각화 #머신러닝 #비즈니스인사이트

오프라인 비즈니스에서의 데이터 분석과 시각화

오프라인 고객 분석을 하며 도출했던 인사이트와 분석 시각화에 관련한 발표입니다 :)

speaker

이찬우

orbis.ai

#Machine Learning #Deep Learning #Affective computing #Distributed System

데이터 뒷담화 현장

데이터에게 맞고사는 데이터 사이언티스트들의 뒷담화 현장을 만들어봅니다. dirty-work 라고 알려진 데이터 사이언티스트/엔지니어들의 공감대를 만들어봅니다.

speaker

이유한

카이스트 생명화학공학과 분자시뮬레이션 실험실 (Kaggle Korea)

#데이터사이언스 #딥러닝 in chemical engineering

Show me the Kaggle medal

치열했던 Home credit default rist competition 후기를 알려드리겠습니다. 캐글 속 첫메달의 감동을 느껴보세요.

speaker

이규영

11번가

#Data_science #Machine_learning #Optimization

머신러닝을 위한 수학 - 최적화

확정적(Deterministic), 확률적(Stochastic) 최적화, 휴리스틱 최적화를 기법을 소개하고, 머신러닝, 딥러닝, 강화학습을 최적화의 관점에서 이해하기

speaker

차현나

스타벅스코리아 데이터마케팅팀

#데이터 #오프라인/리테일 #소비자심리

리테일 기업의 빅데이터 분석

오프라인 매장 고객의 마음을 찾는 데이터 분석

speaker

조동환

SKT DT추진단장

#data_transformation #data_science

[keynote] 기업 현장에서의 데이터 과학

실제 기업 현장에서 데이터 과학이 제대로 활용되기 위한 운영 환경은 어떻게 구성해야 하고 어떤 고려사항들이 있는지, 데이터 과학을 기업 실무에 적용하여 디지털 트랜스포메이션을 할 때 주로 어떤 어려움에 봉착하게 되고 이를 어떻게 극복해야 하는지 발표하고자 합니다.

Keynote speaker

KEYNOTE SPEAKER

"[keynote] 기업 현장에서의 데이터 과학"

  • 장소: Room A~C (전체)

  • 시간: 11 a.m.~11:40 a.m.

발표자: 조동환

SKT DT추진단장

관심분야: #data_transformation #data_science

소개

SK텔레콤 DT추진단 단장 겸 Intelligent platform 그룹장. SK텔레콤 전사 data transformation과 데이터 기반 서비스화 추진의 총 책임을 맡고 있다. TmaxSoft Business Applications 연구개발실장과 Coupang의 Data Intelligence 연구소장을 지낸 바 있으며, 페이스북 그룹 Data science korea의 운영자이다. KAIST에서 컴퓨터공학 학사와 Database security 석사학위를 받았다.

"실제 기업 현장에서 데이터 과학이 제대로 활용되기 위한 운영 환경은 어떻게 구성해야 하고 어떤 고려사항들이 있는지, 데이터 과학을 기업 실무에 적용하여 디지털 트랜스포메이션을 할 때 주로 어떤 어려움에 봉착하게 되고 이를 어떻게 극복해야 하는지 발표하고자 합니다."

KEYNOTE SPEAKER

"[keynote] Mastering Machine Learning with Competitions"

  • 장소: Room A~C (전체)

  • 시간: 11:40 a.m.~12:40 p.m.

발표자: 이정윤

Microsoft

관심분야: #머신러닝 #머신러닝컴피티션

소개

마이크로소프트 본사 데이터사이언티스트. 국제 데이터분석 학회 ACM SIGKDD의 KDD Cup 공동의장과 국내 스마트 재활치료 솔루션 회사, 네오펙트을 비롯한 국내외 스타트업의 기술 자문을 맡고 있다. KDD Cup 2012, 2015 및 국제 머신러닝 대회에서 다수 수상하였으며 머신러닝 대회 플랫폼 캐글에서 40만명의 데이터사이언티스트 중 탑10을 차지한 바 있다. 서울대에서 전기공학부 학사 학위를, 미국 남가주대학교에서 전기공학 석사학위와 컴퓨터과학 박사학위를 받았다.

"지난 8년간 80회 이상의 머신러닝 대회에 참가하고, 최근 KDD Cup과 마이크로소프트 OneML 대회를 운영한 생생한 경험을 나누고자 합니다. 머신러닝 대회의 역사와 현재, 유익과 오해, 그리고 머신러닝 대회에서 성공하기 위한 팁에 대해 다룰 예정입니다."

캐글과 데이터 분석을 함께해요!

데이터를 쉽게 뽀개는 것을 목표로 수평적으로 공부할 수 있는 오픈 모임을 지향합니다

캐글뽀개기 바로가기