[네트워크] 스팀잇과 구글, 다른 듯 같은 알고리즘.
네트워크 두 번째 이야기, 이번에는 스팀잇과 구글의 공통점을 찾아보려고 합니다.
스팀잇? 구글? 무슨 공통점? 영어말고 뭐가 있지? 검색? 이런 생각들 하실 텐데, 바로 네트워크 구조에서 찾아볼 수 있습니다.
네트워크 첫 번째 글에서 말한 바와 같이, 일상 대부분의 네트워크는 scale-free network 또는
허브 앤 스포크 네트워크, 쉽게 말해 소수가 다수를 압도하는 네트워크로 구성되어 있습니다.
스팀잇 내에서는 '고래'가 허브 역할을 한다는 것은 쉽게 이해가 되는 데,
구글 내에서도 허브와 스포크가 있다? 무슨 말일까요?
구글과 네이버, 혹은 다른 포털을 이용해보면 가장 원하는 검색 결과는 대부분 구글에서 나오게 됩니다.
(한글은 예외가 있을 지 모르나 특히 영어에서!)
구글은 그 어떤 포털보다 검색 시 위에 있는 링크일수록 사용자의 만족도가 높은 편인데요
이러한 비밀은 'PageRank'라는 알고리즘으로 모두 설명이 가능합니다.
그럼 이제 PageRank 알고리즘을 알아볼까요?
위 그림은 PageRank를 설명하는 데에 없어서는 안 될 그림입니다.
PageRank는 이름 그대로 '해당 Page를 링크(인용?)한 곳이 많을수록 Rank가 올라간다' 입니다.
그런데 위 그림에서 C와 E를 비교해보면, C는 분명 한 페이지와만 링크를 주고 받는 반면,
E는 한 페이지와 링크를 주고 받을 뿐만 아니라 여섯 개의 링크가 추가로 연결되어 있습니다.
하지만 PageRank는 C가 E의 4배 이상 높은 수치를 기록하고 있지요. (응?)
일단 구글을 마저 살펴보면, 이런 일이 생기는 이유는 뭘까요? 이는 바로 해당 링크를 주고 받는 페이지의 영향력 때문입니다.
E와 연결된 페이지는 모두 4%이하의 영향력을 가진 반면, C는 영향력이 가장 큰 허브 B와 연결되어 있죠.
이번에는 다시 스팀잇으로 돌아와서, 자신과 비슷한 팔로워를 가졌음에도 압도적으로 높은 보팅을 받는 분들의 글을 심심치 않게 볼수 있습니다. 직관적으로도 알 수 있겠지만, PageRank로 설명하자면 이들은 영향력이 큰 이른바 '고래'분들과 연결되었으리라 쉽게 추측할 수 있겠죠? 너무 당연한가요?
좋은글 잘 봤습니다. 선팔하고 가겠습니다 맞팔 부탁드려용
네 감사합니다! 맞팔했어요~
좋은글이네요 덕분에 배우고 갑니다! 보팅 팔로우 하고 가요~ 맞팔 부탁드립니다 ^^
부족한 점 많은 데, 칭찬 감사합니다.
반사갈게요~
Page Rank 에 대해서 또 오늘 아침부터 하나 배웁니다.
감사합니다. ^^
이제야 봤네요. 부족하지만 읽어주셔서 감사해요!