Od czego zależy liczba głosów, którą otrzymuje post?

in #polish6 years ago

Wstęp

Na tagu #polish każdego dnia pojawia się bardzo dużo treści. Jedne z nich otrzymują więcej głosów, a inne mniej. Czy zależy to tylko od jakości postu? Czy wpływ ma też reputacja / STEEM POWER / liczba obserwujących autora? Na te pytania postaramy się odpowiedzieć w poniższym artykule.
Dane pochodzą z bazy http://steemsql.com/ i dotyczą postów dodanych w ciągu 90 dni.

Histogram liczby głosów

Sprawdźmy na początek jak wygląda rozkład liczby głosów.

Średnia liczba głosów jakie otrzymał post to 13.8. Połowa postów otrzymała co najwyżej 7 głosów. Najczęściej występująca wartość to 3. Stosunkowo wysokie odchylenie standardowe świadczy o tym, że "rozstrzał" jest dość spory.

..
Średnia13.8
Mediana7
Dominanta3
Odchylenie standardowe21.9

Wpływ reputacji

Każdy punkt na poniższym wykresie to użytkownik posiadający określoną reputację oraz średnią liczbę głosów. Widzimy, że wartości rosną w miarę zwiększania się reputacji.

Na dodatkowym wykresie skupimy się tylko na użytkownikach o reputacji równej przynajmniej 25 (jaką posiada zdecydowana większość użytkowników). Dzięki temu możemy "przybliżyć" bardziej istotną część wykresu.

Korelacja jest umiarkowana i wynosi: 0.436.

Wpływ STEEM POWER

Kolejny badany parametr to STEEM POWER. Wykres niestety wyszedł mało interesujący, więc na dodatkowym wykresie weźmiemy pod uwagę tylko użytkowników o STEEM POWER poniżej 500.

Tutaj wykres jest już bardziej czytelny. Trudno dopatrzeć się jednak zależności pomiędzy STEEM POWER a średnią liczbą głosów. Potwierdzeniem tego jest dość słaba korelacja, która wynosi: 0.1772.

Wpływ liczby obserwujących

Na koniec sprawdzimy jeszcze liczbę obserwujących. Z jednej strony konto z dużą liczbą obserwujących ma większe zasięgi, ale z drugiej pojawia się tutaj problem z pustymi obserwacjami od botów.

Skupmy się jeszcze na użytkownikach mających co najwyżej 1000 obserwujących. Korelacja jest nieco słabsza niż w przypadku reputacji, ale silniejsza niż w przypadku liczby STEEM POWER i wynosi 0.3678.

Użytkownicy o największej średniej liczbie głosów

Sprawdźmy też, którzy użytkownicy mają największą średnią liczbę głosów. Pominięci zostali użytkownicy, którzy mieli tylko jeden post, dzięki czemu wyniki są bardziej miarodajne.

.UżytkownikŚrednia liczba głosówLiczba postów
1rafonixofficial411.98
2carrioner187.216
3philk109.616
4mys96.02
5steemitlabs91.84
6santarius91.45
7kolegaotaku87.02
8mmmmkkkk31186.715
9noisy286.48
10fervi81.090
11firesteem77.29
12dawid198075.02
13jacekw71.114
14kurator-polski69.733
15marczanto67.122
16nicniezgrublem64.45
17neopch63.86
18yourmind61.84
19voitaksoutache61.05
20evolutionnow58.58
21anna.urbanska55.719
22marszum54.322
23rafalski53.914
24steem-hikers-pl53.52
25thomaslucania53.315
26bitcoinprank52.616
27astromaniak52.173
28saunter-pl50.610
29bolgan50.52
30smashedturtle49.52
31uszi49.52
32synchrotronics48.33
33ripbranzakrypto47.52
34marcon47.45
35kam.ila47.02
36bowess46.935
37wadera46.921
38glodniwiedzy46.6116
39sisters46.69
40grecki-bazar-ewy45.948
41iyuta45.73
42photo.ethernity45.33
43cebula45.237
44poprostuem44.65
45polish-cleaners44.24
46kusior44.234
47opti44.210
48highonthehog44.116
49steemit-polska43.654
50photovisions42.33
51michalx2008x42.268
52logan985242.135
53tapioka42.017
54diosbot41.412
55foremostwiseguy41.36
56diabelsky41.03
57philipchuckk41.05
58kapitanpolak41.042
59polishcraftbeers40.07
60zdrowie39.845
61grzechotnik39.58
62arabson199039.433
63annaburska39.018
64woodlandia38.85
65mastek38.312
66barbarossastudio37.927
67gtelefon37.836
68petecko37.45
69barcisz36.84
70alcik36.73
71assayer36.526
72katayah36.319
73jplaughing35.52
74lynxialicious35.52
75unknow35.210
76zbudujprojekt35.03
77hch34.746
78tkolpaczek34.52
79magnus1934.413
80zgredek34.02
81kelthuzzar34.03
82zygibo34.02
83kolorowa.wedzma33.812
84postcardsfromlbn33.625
85gotsummerpl33.551
86yavinlecretin33.37
87andzi7633.090
88chewing32.84
89kryptoraport32.449
90markoslaw32.03
91patrycja10032.03
92aditor32.011
93pibyk31.920
94lewybut31.86
95strimi31.73
96foodini31.641
97patryk131.52
98soldierka31.410
99breadcentric31.37
100hitsug31.37

Tagi o największej średniej liczbie głosów

Na koniec, to samo co wyżej, ale dla tagów.

.TagŚrednia liczba głosówLiczba postów
1nikura70.929
2pl-wise68.52
3pl-nowyja67.76
4pl-unix67.413
5pl-pisownia66.54
6pl-linux64.335
7pl-gamedev54.817
8pl-archeologia52.33
9pl-wnetrza51.73
10pl-parapsychologia50.52
11pl-publikacje50.414
12pl-mars49.68
13pl-theboringcompany49.02
14pl-rakiety48.52
15pl-elonmusk48.24
16pl-statystyki47.828
17pl-paleontologia47.73
18pl-ai47.33
19pl-spacex47.02
20pl-newspace46.33
21pl-chiny46.03
22pl-tesla45.52
23pl-klimat44.85
24pl-mamakonkurs44.52
25poznajeksperta44.253
26pl-zagadka44.02
27pl-projekty41.73
28pl-hyperloop41.02
29pl-astronomia40.120
30pl-kosmos38.7127
31pl-fizyka38.04
32pl-steem38.0204
33pl-dyskusje37.012
34pl-pornografia37.02
35pl-spektroskopia37.07
36pl-nasa36.67
37pl-esa36.52
38pl-100latniepodleglej36.412
39pl-konkurs35.6157
40tematygodnia34.7349
41pl-media34.52
42pl-fakty33.52
43pl-niepelnosprawnosc33.54
44pl-samochodyelektryczne32.77
45pl-ssaki32.52
46pl-filozofia32.415
47pl-transport31.54
48pl-nauka31.1280
49pl-bliskiwschod31.024
50pl-zwierzeta30.2139
51pl-hazard29.52
52labirynt-swiata29.333
53pl-dom29.02
54pl-kuchniakonkurs28.7102
55pl-chleb28.76
56pl-ekologia28.512
57pl-zdrowiekonkurs28.45
58pl-prehistoria28.03
59pl-lotnictwo27.97
60pl-steemit27.5207
61pl-srodowisko27.48
62pl-silownia27.37
63pl-geopolityka27.143
64pl-artykuly27.13157
65pl-programowanie27.044
66pl-architektura26.9118
67pl-religia26.9139
68pl-sportkonkurs26.914
69pl-medycyna26.843
70pl-rekodzielo26.7103
71pl-afryka26.73
72pl-prawo26.434
73pl-konkursy25.73
74pl-seks25.52
75pl-gruzja25.02
76pl-ciekawoski25.02
77pl-emocjonalny24.52
78pl-minaldzien24.52
79pl-podroze24.3300
80pl-usa24.02
81pl-wino23.52
82pl-atykuly23.52
83pl-emocjonalnie23.3504
84pl-wege23.2141
85pl-drewno23.02
86pl-rozwojosobisty23.03
87pl-ciekawostki22.8284
88pl-sentymentalnie22.84
89pl-zdrowie22.7341
90pl-diy22.418
91pl-grykonkurs22.045
92pl-poradniki21.617
93pl-21.52
94pl-filc21.52
95pl-ogrod21.565
96pl-dzieci21.429
97pl-psychologia21.378
98pl-kultura21.174
99pl-arykuly21.03
100pl-spolecznosc21.04

Podsumowanie

Okazuje się, że pewien wpływ na średnią liczbę głosów ma reputacja użytkownika oraz liczba obserwujących. Wpływ samego STEEM POWER jest raczej niewielki. Ważne jest też wyrobienie sobie pewnej marki konta oraz wybór tagu (jedne są bardziej popularne inne mniej).
Tutaj, jako miara popularności postów, została wybrana liczba głosów. Jednak taką samą analizę można też wykonać dla średniej nagrody za post.

Sort:  

Witam pozdrawiam serdecznie:)
Ludzie jestem tu pierwszy raz , nie wiem jak przylajkowac ten dobry artykół i prosze o podpowiedź jak wyszukiwac tagi; chcialbym np. poczytac tego pl-tesla.

dziękuję za taką bogatą odpowiedź super. jak ty znalazłeś tyle postów tak szybko? właśnie tego Chciałbym się dowiedzieć żeby wyszukiwać

Dzięki. ostatnie pytanie , gdzie tu jest jakieś noł hał po Polsku?

Jeśli się dodaje swój pierwszy post w tagu #polish to bot @informator wkleja użyteczne informacje, tak jak tutaj: https://steemit.com/polish/@informator/re-musicchannel-krotko-o-muzyce-klubowej-1529662356964tf3626ee7-0d9c-4377-b2b8-06b34cbcb3b1uid
Taki swego rodzaju FAQ można znaleźć tu https://steemweb.pl/faq, a w szczególności warty przeczytania jest ten artykuł https://steemit.com/polish/@jamzed/steem-it-w-pigulce

Warto też wpaść na czat: https://steem.chat/channel/polish (trzeba założyć osobne konto).

Bóg zapłać😇

troche za mała gradacja.

Można by się pokusić o osobną analize postów publikowanych na Steemit, DTube, DLive. Np. te z DLive zawsze mają zupełnie inną charakterystykę. Np. osoba, która pisze coś na czacie DLive (który jest off-chain), prawie na pewno da jakiś upvote.

Zamiast bycia followowanym można by sprawdzić, na którym miejscu w feedzie miała dana osoba dany post w momencie głosu, ale to było by bardzo trudne do policzenia (aczkolwiek możliwe i tam bym spodziewał się dużo większych relacji).

Według mnie oprócz oczywistej relacji (jakość -> liczba głosów) zawsze powinna się zarysowywać relacja widoczność -> liczba głosów).

Więc można zacząć analizować wszystkie sposoby na bycie widocznym oraz to jak to się przekłada na głosowanie.

Jak zwykle profeska! 👍
A czy znasz Jacku jakiś sposób żeby "przesiać" z tych głosów boty?
Jestem bardzo ciekawy ile z nich pochodzi od normalnych użytkowników, a ile od maszynek.

Może brać pod uwagę tylko głosujących z reputacją powyżej 25? Boty zazwyczaj są minusowane i ich reputacja schodzi do zera.

To jeszcze zależy co @foodini miał na myśli - czy bid-boty (jest lista, więc to łatwe) czy boty, które dają masowe obserwacje (te i tak zwykle nie głosują; tutaj można je eliminować sprawdzając ile kont obserwują) czy jakieś automaty / curation-traile.

Głosy od bidbotów można łatwo pominąć.
Boty, które dają obserwacje, zwykle i tak nie głosują, więc do średniej liczby głosów się nie dokładają.
Ale jakieś boty z curation-trail czy działające jako automat do głosowania (żeby sobie maksymalizować nagrody z kuracji) to już trudniej :)

Chodzi mi o boty, które głosują zaraz po dodaniu posta. Kiedy wrzucam film to w ciągu kilku minut mam od nich ok 30 upvotów. Mają po 25 repu, same resteemy, nazwy z czapki i od razu widać, że to nie są "żywe" konta.
Wprowadzam trochę zmian na profilu i chciałbym zliczać upvoty raz w tygodniu, ale doliczanie tych botów bardzo wypaczy mi wyniki.
Oczywiście mogę to sprawdzać "ręcznie", ale może nasz jakiś łatwiejszy sposób?

Masa tagów o których w ogóle nie miałam pojęcia. Co do głosów to myśle ze warto wchodzić w interakcje z użytkownikami, tak zwyczajnie, nie na sile. Sama tez widzę ze lepiej takie osoby pamietam, poznaje je a to jednak pózniej wpływa tez na mój głos.

Tutaj niejako większe szanse na znalezienie się w tabeli miały mało znane tagi (bo średnia jest liczona z mniejszej liczby postów), dlatego znalazło się takie, a nie inne. Co do interakcji to prawda, tym bardziej, że człowiek chętniej zagląda do postów osoby, która wcześniej dała się poznać z dobrej strony :)

I ogólnie do osoby, która w jakiś sposób kojarzy.

Świetny artykuł. Nie narzekam na moje oceny, tak jak piszesz, ważne jest wyrobienie sobie marki- więc ja praktycznie na nic nie liczyłam a coś tam mam i zawsze to coś cieszy. Ale przedewszystkim ciesze się, że zobaczyłam tyle polskich tagów. Dotychczas nawet połowy z nich nie znałam :D

Tutaj wskaźnikiem była średnia liczba głosów, więc jeśli tag był użyty np tylko 2 razy, ale posty z tym tagiem dostały całkiem sporo głosów, to już się zakwalifikował do tabeli. Stąd niektóre wymienione tagi są dość mało znane. Ja lubię sobie czasem spojrzeć https://steemweb.pl/tags lub tutaj https://steemweb.pl/categories, ewentualnie tutaj https://steemit.com/polish/@jacekw/3ppbtr-najbardziej-aktywni-autorzy-w-popularnych-tagach-30-dni, żeby popatrzeć co tam w trawie piszczy z tymi tagami :)

Takie analizy to miód na moją nerdowską duszę <3 Ciekawa sprawa.

Nawet przy reputacji która ma tutaj najsilniejszą korelację, wydaje się ona nie być aż tak silna i determinująca. To chyba dobrze, nie ma takiego zjawiska, że sama w sobie reputacja oznacza dużą ilość głosów. Czyli ludzie jednak kierują się trochę jakością (wspomniane posiadanie wyrobionej marki jest objawem m.in. jakości)

Tak, jakość artykułów to główny faktor. Ale właśnie z ciekawości chciałem sprawdzić czy inne czynniki też mają duży wpływ. Czy popularny użytkownik z bardzo dobrym artykułem dostanie znacząco więcej głosów od przeciętnego użytkownika z tak samo dobrym artykułem.
Ja jestem zadowolony z wyników, przed analizą myślałem, że np posiadany STEEM POWER będzie miał większy wpływ, a tu się okazuje, że jednak nie :)

Wpływ samego STEEM POWER jest raczej niewielki.

A to mnie zaskoczyło. Spodziewałbym się raczej mechanizmu: duże SP = dużo oddanych głosów (dzięki suwakowi) = dużo głosów od innych.

Też mnie to zdziwiło, myślałem, że będzie miało większy wpływ. Podejrzewam, że jak ktoś zdobył STEEM POWER budując sobie markę konta, to wtedy korelacja jest silniejsza. Ale jak ktoś kupił STEEM POWER to już słabsza.

Zaskakujące wyniki... ;)

Ciekawe te Twoje obserwacje, tym ciekawsze dla takie świeżaka na steemit jak ja :).

Statystyki jak zwykle super :)

Zdziwiło mnie, że SP ma tak znikomy wpływ.
Trochę szkoda że w tabeli z tagami na wysokich miejscach znajdują się tagi z malutką liczbą postów, no ale cóż... tak działa średnia ;)

P.S. nieźle w tekście wyjaśniłeś czym jest mediana i dominanta ;)

Tak teraz myślę, że mogłem na minimum ustawić np 5 wystąpień, a nie 2, ale już nie będę zmieniał, przynajmniej można sobie popatrzeć na jakieś bardziej egzotyczne tagi :)
A z tym STEEM POWER to możliwe, że noisy wszystko psuje. Bo ma powiedzmy 200x więcej SP niż przeciętny użytkownik, ale głosów tylko trochę więcej :D