[Interesteem] 인터레스팀 - 관심사 기반 딥러닝 큐레이션 프로젝트를 공개합니다.

in #kr6 years ago (edited)

스티미언 여러분 안녕하세요.

저는 현재 검색 회사에서 머신러닝, AI 기반 검색/추천 관련 일을 하고있는 개발자 입니다. 스팀잇 하시면서 관심 있는 연관 글 찾기 힘드셨죠? 해당 문제를 해결하고자 프로젝트를 만들고 작업한 내용을 공개 하고자 합니다.

logo

인터레스팀

인터레스팀은 딥러닝을 사용하여 관심 있을 만한 연관 컨텐츠를 자동으로 추천 함으로써 다양하고 풍부한 컨텐츠 소비를 촉진 시키는 것을 목표로 하는 프로젝트 입니다. v1 에서는 interesteem 이라는 태그를 달고 글을 등록 하시면 자동으로 해당 글에 댓글로 연관된 스팀잇 컨텐츠를 추천해 줍니다. 어떤 식으로 추천될까요? 작업 한 내용 중에서 몇가지 샘플을 뽑아 보았습니다.

( 아직 제가 데이터 확보가 충분하지 않아 대부분 페이아웃 기간 내 글과 전체 글이 중복됩니다. ㅠㅠ 데이터를 더 확보하여 풍부한 컨텐츠를 제공할 예정입니다. )

Sample1 )

보고 있는 컨텐츠 : 투표 안하는 사람과 절교하기!

보고 있는 컨텐츠 기반 추출된 결과 ( 댓글로 남겨짐 ) :

아직 Payout 되지 않은 관련 글
  1. 자고로 정치에 있어서 투표의 본질은 ??? ( 86.96 % )
  2. 선거를 지켜보며. ( 85.67 % )
  3. 60.2% ( 85.60 % )
  4. 트럼프에 대한 선입견 ( 85.12 % )
  5. [투표후기] 우려 섞인 기대가 아닌 진정한 기대를 가질 날을 기대합니다 ( 84.84 % )
모든 기간 관련 글
  1. 자고로 정치에 있어서 투표의 본질은 ??? ( 86.96 % )
  2. 선거를 지켜보며. ( 85.67 % )
  3. 60.2% ( 85.60 % )
  4. 트럼프에 대한 선입견 ( 85.12 % )
  5. [투표후기] 우려 섞인 기대가 아닌 진정한 기대를 가질 날을 기대합니다 ( 84.84 % )

오차는 있지만 투표 라는 주제와 연관된 컨텐츠를 어느정도 선별해 제공 하는 모습을 보입니다. 좀더 정확도를 높여야 할 것 같습니다.

Sample 2)

보고있는 컨텐츠 제목 : 김포카페 밀크티가 맛있는 카페진정성

보고 있는 컨텐츠 기반 추출된 결과 ( 댓글로 남겨짐 ) :

아직 Payout 되지 않은 관련 글
  1. 수제 당근케이크가 맛있는 브런치카페 'BULA' ( 86.58 % )
  2. 뉴질랜드 골짜기 별장 같은 카페, 푸호이 밸리에서 만나는 신선한 치즈의 향연 ( 85.45 % )
  3. 정원카페&레스토랑 “의정부 오크힐 스테이크” ( 85.29 % )
  4. [샤로수길]티라노커피- 석기시대 초콜릿주는 카페 ( 84.23 % )
  5. [헤이리마을] 더 장미 카페 ( 81.90 % )
모든 기간 관련 글
  1. 수제 당근케이크가 맛있는 브런치카페 'BULA' ( 86.58 % )
  2. 뉴질랜드 골짜기 별장 같은 카페, 푸호이 밸리에서 만나는 신선한 치즈의 향연 ( 85.45 % )
  3. 정원카페&레스토랑 “의정부 오크힐 스테이크” ( 85.29 % )
  4. [Tasteem] 호치민2군 카페 - Thao Dien Village ( 84.40 % )
  5. [샤로수길]티라노커피- 석기시대 초콜릿주는 카페 ( 84.23 % )

Sample 3)

보고있는 컨텐츠 제목 : 이것은 김정은이 살고있는 집의 모습이다

보고 있는 컨텐츠 기반 추출된 결과 ( 댓글로 남겨짐 ) :

아직 Payout 되지 않은 관련 글
  1. [My Find US -North Korea Summit in Singapore] 세기의 회담 북미정상회담를 바라보며 (일본현지반응 소개) ( 82.65 % )
  2. (한반도 정세) 미-북 정상회담 관련 미국 일간지 반응 모음 ; 사설을 중심으로 ( 79.95 % )
  3. 북미 정상 손잡는 순간 본 시민들 “한반도 평화 닻 올린 역사적인 날” ( 78.58 % )
  4. 공동경비구역 JSA와 북미 정상회담 ( 76.40 % )
  5. [기자수첩] 역사상 첫 북미 정상회담의 또 다른 승자, ‘싱가포르’ ( 76.04 % )
모든 기간 관련 글
  1. [My Find US -North Korea Summit in Singapore] 세기의 회담 북미정상회담를 바라보며 (일본현지반응 소개) ( 82.65 % )
  2. (한반도 정세) 미-북 정상회담 관련 미국 일간지 반응 모음 ; 사설을 중심으로 ( 79.95 % )
  3. 북미 정상 손잡는 순간 본 시민들 “한반도 평화 닻 올린 역사적인 날” ( 78.58 % )
  4. 내일 북미회담에서 큰결과는 안나올수도,, ( 77.31 % )
  5. 공동경비구역 JSA와 북미 정상회담 ( 76.40 % )

Sample 4)

보고있는 컨텐츠 제목 : 매일한자 ‘독백, 산부’

보고 있는 컨텐츠 기반 추출된 결과 ( 댓글로 남겨짐 ) :

아직 Payout 되지 않은 관련 글
  1. 매일한자 ‘만복’ ( 81.47 % )
  2. [언어蟲: 漢字] 人 (사람인) 어원(語源); @SteamSteem's Creativity ( 81.13 % )
  3. 매일한자 ‘경마’ ( 80.08 % )
  4. [어학/languages] "태국어/Thai" 32탄 / 중급예문 & 초급분석 “내가 도착하기 전에 그는 이미 가 버렸다" ( 79.81 % )
  5. [오늘의 English 단어] #63. 우리 사이 목과 목 사이 - Neck and Neck ( 79.50 % )
모든 기간 관련 글
  1. 매일한자 ‘무죄, 재난, 어장’ ( 83.23 % )
  2. 매일한자 ‘당도’ ( 83.22 % )
  3. 매일한자 ‘열심’ ( 82.59 % )
  4. 매일한자 ‘만복’ ( 81.47 % )
  5. [언어蟲: 漢字] 人 (사람인) 어원(語源); @SteamSteem's Creativity ( 81.13 % )

스팀잇 에서는 페이아웃 제한시간이 중요하기 때문에 아직 페이아웃 기간이 남은 컨텐츠 우선으로 보여주고 있습니다. 괄호 안은 유사도 인데요, 스팀잇 에서 아직은 컨텐츠가 다양하지 않아 아무리 비슷해도 80% 정도의 유사도를 보이는 글 밖에 찾을수 없는 경우가 많습니다.

현재 베타 버전에서는현업에서 사용하는 기법중 적용하기 쉬운 방식 만을 빠르게 적용 하였기 때문에 부족한 점이 많습니다. 향후 꾸준히 보완 해 나갈 예정입니다.

인터레스팀 사용법

  • 글을 등록할때 interesteem 태그를 넣습니다.
  • 기다립니다. 일정 주기마다 인터레스팀 봇이 댓글로 작성하신 글과 연관 되면서 사람들이 많이 클릭 할 것 같은 글을 추천합니다.

왜 인터레스팀이 필요 한가요?

1. 스팀잇에 숨겨진 수많은 황금 컨텐츠를 더 잘 볼 수 있습니다. ( 독자에게 이득 )

프로젝트를 진행 하면서 스팀잇에 존재하는 여러가지 컨텐츠를 살펴 보았습니다. 매우 흥미롭고 훌륭한 컨텐츠가 생각보다 훨씬 많았습니다. 하지만 그런 글들은 직접 타겟팅 해서 검색 하거나 저처럼 특수한 목적으로 데이터를 훑어 보지 않는 이상 시간에 묻어져 발견되기 힘듭니다. 만약 독자가 글을 읽을때 연관된 황금 컨텐츠를 함께 보여 준다면 어떨까요? 독자 입장에서는 관심 있는 글을 일종의 카테고라이징 형식으로 볼 수 있어 훨씬 도움 될 것이라 생각 됩니다.

2. 제한 기간(페이아웃) 내에 최대한 노출 시켜 더 많은 보상을 받을 수 있습니다. ( 저자에게 이득 )

스팀잇 에서는 일정 기간이 지나면 컨텐츠로 부터 보상을 더 이상 받지 못합니다. 즉 제한 기간 내에 최대한 컨텐츠가 많이 소비 될 수 있도록 노출 시켜야 한다는 것 입니다. 인터레스팀은 연관된 모든 글을 추천해 주나, 보상 제한 기간 이내 이면서 인터레스팀을 사용해 등록한 글을 좀더 우선적으로 보여 줄 예정입니다. 내 글이 다른 사람의 연관 있는 글을 통해 더 많은 사람에게 보여 질 것입니다.

3. 현재 커뮤니티 에서 이슈가 되고 있는 스팀잇의 몇가지 문제를 간접적으로 해결 해 줄 것이라 생각됩니다.

제가 파악하기로 스팀잇 플랫폼에 보팅봇과 같은 몇가지 큐레이션 관련된 이슈가 있다고 알고 있습니다. 언급한 이슈가 플랫폼 경제의 한 부분을 담당하고 있다고 생각이 드는 반면, 큐레이션 본질을 해치고 돈에 의해서만 큐레이팅 되고 노출 되는 것은 개선될 필요가 있다고 생각합니다. 만약 사람들이 어뷰징이 심한 트렌딩 탭을 사용하지 않고, 잘 정돈되고 세분화된 큐레이션을 사용 한다면 사용성도 늘고 만족도도 높아질 뿐더러, 현재 문제되고 있는 이슈들도 어느정도는 해결 될 것이라고 생각 합니다.

4. 향후 조회수 기반, 영원한 저자 보상을 통해 수익을 극대화 시킬 수 있습니다.

나온지 20년, 30년이 지난 역대 명작 영화들이 아직도 사랑 받는 것처럼, 영혼이 담긴 컨텐츠 역시 시간이 지나도 사랑받고 보상 받을 자격이 충분 하다고 생각합니다. 인터레스팀 프로젝트를 통해 하고 싶은 것은, SMT 를 사용한 커뮤니티를 만들고 큐레이션을 통해 제한시간에 구애받지 않는 컨텐츠를 소비하면서 이를 통해 조회수 기반 지속적이고 영원한 저자 보상을 주는 스팀잇 기반 플랫폼을 구성 하고자 합니다.

향후 계획

  1. v1 개발 - 완료
  2. v2 개발 - 인터레스팀 웹사이트 개발
  3. v3 개발 - 인터레스팀 기반 영원한 저자보상 개발

마무리 ( feat. 보팅 기반 큐레이션은 실패 했다고 생각 합니다 )

도발적인 발언 이라고 생각 합니다. 물론 보팅을 통해 얼마든지 훌륭한 큐레이션이 나올 수 있다고 생각합니다. 허나 보팅에 금전적인 댓가가 지불 되는 순간, 글의 내용 보다는 다른 것을 우선 할 수밖에 없습니다. 더군다나 사람이 하는 큐레이션은 자원이 한정 되어 있기 때문에 한계가 있습니다. 플랫폼의 헤비 유저가 아닌 이상 스팀잇의 수많은 컨텐츠중 극히 일부만을 보고 큐레이팅 하게 됩니다. 저는 사람이 전적으로 큐레이팅 하기 보다는 기계에 의해 어느정도 큐레이션을 선별 한 후 사람이 매니징 하는 방향으로 흘러 가야 한다고 생각합니다.

귀찮은건 기계에게 맡기시죠.

감사합니다.

Sort:  

좋은 기능 감사합니다.
그런데 자신의 글은 배제하면 좋겠습니다.

테그를 사용했더니 제글이 많이 나와서 다른 분들을 ㅂㅎ고 싶은데

와우..
재미 있는 시도 이군요.

설명을 보다보니,
제 글도 하나 선정되어, 기쁩니다. ^..^

지금 스팀잇에 가장 필요한 기술인 듯합니다.
유튜브 같은 경우에도 유사한 콘텐츠를 선별해주는데 이것이 많은 도움이 되고 결국 이런 서비스가 유투브를 강력하게 만드는 것 같습니다.
사실 이런 서비스는 스팀잇 본사에서 해야할 정도로 중요한 일이라고 생각합니다.
좋은 성과 있었으면 좋겠습니다

아 늦게 봤습니다. 좋은 서비스 감사합니다.
혹 한국어만 되는건가요? 아니면 언어에 상관없이 작동하는건가요?

관심 갖어주셔서 감사합니다! 현재는 한국어만 동작하는데 현재 영어에 대해서도 동작하도록 작업 중입니다 감사합니다 ^^

우와~ 이거 좋네요~^^
저는 만화나 웹툰쪽, 장르소설에 관심이 있는데 해당 글을 찾기가 쉽지 않았었거든요~
응원합니다~

네 바로 말씀하신 이유 때문에 좀더 글을 찾기 편하도록 만들어 보았습니다. 지금 구상 하기로는 장르로 관련 있는 글찾기 (예를들어 스릴러와 관련된 글 찾기 등등 ) 기능도 가능할 것 같습니다. 단순히 단어 매칭이 아니라 어느정도 의미가 비슷한 글도 찾아주거든요!!

좋은글 잘 읽었습니다~

스팀잇을 한층 더 발전시켜주는 프로젝트같네요

스팀잇은 지금보다 훨씬 나아질 가능성이 있는 플랫폼 입니다. 지금 갖고 있는 여러가지 문제점을 해결하면 어디까지 날아갈지 궁금하군요!! 감사합니다

현재 스팀잇의 한계를 보완해줄 수 있는 멋진 서비스네요..!
리스팀합니다 :-)

몇가지 불편 사항을 조금만 개선해 준다면 스팀잇이 좀더 날아 오를 것이라고 생각합니다. 다행히 제가 가진 기술이 도움이 될 수 있을 것 같군요 :)

와 이런 ....좋은 서비스입니다. 꼭 필요한 서비스같아요
interesteem 님 응원드리고 팔로했어요^^ 교류해요
09__묃뀫__꼪_⒰꼨__.gif

팔로우 및 응원 감사합니다 ^^ 많이 사용해주세요~

인터레스팀이라니! 이름도 굉장히 마음에 듭니다 ㅎㅎ 응원합니다~

처음 이름 지었을때 좀 이상한가 싶었는데 조금씩 지나면서 익숙해 지는군요 ^^ 응원 감사합니다!!