⭐️ Kommentare, die in Artikeln münden - ChatGPT und Steemworld
Teil 7 der Serie
#HiermuesstejetzteingeilerHashtagstehen
⭐️ Nutzt ChatGPT Steemworld.org?
⭐️ Es ist mal wieder soweit
dass ein Kommentar "etwas" länger wird. Nach Teil 6 nun Ausgabe 7.
Thema: Wie verwurstelt GPT die Daten zu seinen Antworten?
@mein-senf-dazu hat auf Hive einen Chat Test gemacht und einige Fragen bezüglich den drei BC's STEEM, Hive & Blurt gestellt.
Unter anderem:
Meine Frage: Sind die Nutzer aktiver auf Hive, Steem oder Blurt?
Antwort ChatBot
Es ist schwierig zu sagen, welche der drei Blockchains (Hive, Steem, Blurt) die aktivsten Nutzer hat, da es darauf ankommt, wie man "Aktivität" definiert und welche Messgrößen man verwendet. Jede Blockchain hat ihre eigene Community und ihr eigenes Ökosystem von Nutzern, die auf unterschiedliche Weise aktiv sind.
Ok, viel Blah um nichts, aber es ist infomässig nichts falsch. Wenn man einen Text mit bestimmter Wortlänge benötigt oder als Resultat haben möchte ein netter Lückenfüller, der nach mehr aussieht, als er ist.
Ein Weg, um die Aktivität auf einer Blockchain zu messen, ist die Anzahl der Transaktionen, die pro Tag auf der Blockchain durchgeführt werden. Laut Daten von SteemWorld.org betrug die durchschnittliche Anzahl der Transaktionen pro Tag auf der Steem-Blockchain im Januar 2021 etwa 200.000, während die durchschnittliche Anzahl der Transaktionen pro Tag auf der Hive-Blockchain im selben Zeitraum etwa 70.000 betrug. Die Daten für Blurt sind nicht verfügbar.
Oh ha, jetzt wird es spannend. GPT kennt den Chiller!? Och jo. Klar habe ich den Steemworld.org Creator da mal drauf hingewiesen. Ist ja schliesslich eine nette Weihnachtsüberraschung, wenn sein Baby vom aktuell heissesten Internet-Scheiß einbezogen oder erwähnt wird.
Ein anderer Weg, um die Aktivität auf einer Blockchain zu messen, ist die Anzahl der Benutzer, die auf der Blockchain aktiv sind. Auch hier gibt es keine verlässlichen Daten, die die Aktivität von Nutzern auf Hive, Steem oder Blurt vergleichen.
Hier wieder eine verblümte, aufgeblasene Ausführung von: "Ich hab keinen Plan, was du von mir willst! Mehr hab ich nicht in der Datenbank."
Hört sich aber clever und natürlich auch wahr und realistisch an.
Reaktion von SW CEO
Wow, das ist wirklich beeindruckend! Die KI hat wohl die SDS APIs verwendet, um die Transaktionsanzahl eines Monats zu ermitteln. Dafür gibt es nicht mal direkt eine API-Methode, aber man könnte, wenn man sich eine Weile damit beschäftigt, solche Daten aus den Blöcken des jeweiligen Zeitraums holen. Ziemlich brilliant auf jeden Fall.
Ich darf ja leider nicht mitmachen :(
Ich wäre bis März (wenn dann Version 4 kommt) von der Bildfläche verschwunden mit Statusmeldungen aus der KI Welt. Schade.
Aber zurück zum Thema und der Vermutung von Chiller zu den Daten und Infos vom Bot.
Ich glaube "so kompliziert" ist es gar nicht. Rechnen an sich kann die KI nicht, auch wenn es sich komisch anhört. Mit einfachen Mathereihen (1235x565-88x3) kommt GPT nicht zurecht, was aber nicht schlimm ist. Dafür gibts ja Taschenrechner - lol.
GPT wird es versuchen mit Formeln auf Basis des Datenstandes zu beschreiben, wie du zu dem Resultat kommst, aber wenn es Zahlen sind, die so noch nicht exakt als Beispielrechnung auf einer der einbezogenen Seiten in der Kombi benutzt wurden, dann bekommst du kein Ergebnis.
Soweit ich das Grundprinzip, auf die ersten Bausteine heruntergebrochen, verstanden habe, ist das eine reine 1,0 - ITTT - Geschichte. Der erste Ansatz war wie bei Google - Internet runterladen - nur nicht ganz so umfangreich und spezifischer, weil das ja eher eine Code- und Textmaschine und eben keine Suchmaschine ist.
Da sind GitHub, Wikipedia und andere größere Seiten als Datensatz drinne und dann geht es nach einem logischen 1,0 System Zeichen für Zeichen durch. Wie hoch ist die Wahrscheinlichkeit, dass auf Zeichen 1 Zeichen 2 folgt. Das ist wohl ganz vereinfacht die Grundstruktur.
Edit. 28.12.2022
Nach neueren Erkenntnissen aus Kommentaren und weiterer Recherche
Der Chatbot hat (angeblich) keine Datenbank an sich, sondern hat die Daten "auswendig" gelernt, entsprechende Antworten auf dazu aufkommenden Fragen und einer Verarbeitung, diese durch ständiges weiter lernen, zu beantworten.
In der Lehrerschaft herrscht schon Aufregung -- Weil du dein Wunschergebnis genau definieren kannst.
Z.B.
Schreibe einen Reisebericht über einen Parisausflug in den Sommerferien. Schreibniveau 10. Klasse Gymnasium, füge 3 typische Sehenswürdigkeiten und 2 typische französische Gerichte ein. 350-400 Worte im Stile von Schiller.
(Nicht Chiller, wobei das sicher witziger wäre - lol)
Das Resultat modifizierst du dann mit 2-3 Worten/Sätzen weiter:
Lasse den Eifelturm weg und benutze eine andere Sehenswürdigkeit. Wir hatten Stau im Berufsverkehr und konnten den Eifelturm nicht sehen. Erwähne jedoch am Ende des Artikels in 150 Worten, warum man den Eifelturm besichtigen sollte und zu welchen Uhrzeiten in Paris kein Berufsverkehr herrscht.
Das wird der beste Urlaubsaufsatz ever. Damit kannst du in Stunden einen Bestseller schreiben!
Für Progger auch der Oberknaller - Für Leute wie ich, die da eher wenig Ahnung haben vom coden an sich, ein Paradies und für Profis, wie dich oder jeden anderen Code-Frickler eine Kracher-Hilfe. Du kannst da ja sogar per Voice oder eben Beschreibung genau deinen Wunsch definieren.
Ich hätte gerne den Code für eine Suchfunktion auf meiner Webseite. Basis XY Code in JavaScript. Wenn du da dann im ausgegeben Code Fehler findest, kannst du auch den via Textanweisung ausmerzen lassen oder dann eben manuell eingreifen. Halt praktisch, wenn du einen Bot hast, der z.B. ganz GitHub gespeichert hat und dir da die passenden Vorschläge zusammen strickt.
GitHub hat ja einen ähnlichen Hilfsbot, aber GPT ist eben wesentlich umfangreicher, weil nicht nur die GitHub Daten, sondern weiß der Henker wie viele andere Code und Progger Seiten noch in dieser Datenbank vorhanden sind.
ChatGPT ist KEIN OnlineTool, was in Realtime neue Daten im Netz abfragt, sondern die gespeicherten Daten benutzt und die durch Hilfe der Millionen von Nutzern, die jetzt bei der Öffnung innerhalb von Tagen da eingetrudelt sind, immer weiter in passenden Kontext gesetzt werden. Quasi ein Heer an Lektoren, die der KI jetzt wertvolle Infos liefern, was als gut, weniger gut oder sehr gut gewertet und/oder genutzt wurde.
Mit der Aktualität kann man einfach prüfen. Einfach mal fragen, wer aktuell in Dland Kanzler ist ;)
ABER...
Was dann da als schon angekündigte Version 4 im März kommen soll, wird ein ausgewachsenes Monster sein. Die 3 ist jetzt schon eins, nur noch in den Kinderschuhen, die aber schneller wachsen werden, wie manch einer glauben mag.
Damit wären wir bei der Abschlußfrage:
Woher und wie bezieht GPT die Steemworld Daten?
Meine Vermutung ist ganz lapidar. Irgendwo in einer der Datenquellen (Github, Wiki, Proggerforen, what ever) wurde SW als Hilfstool erwähnt, um die Transaktionsdaten, die ja zur Beantwortung der Frage beitragen, auszulesen.
Die spannendste Frage, die auch gerade die gesamte Lehrerschaft hat, wie sieht es mit diesen Daten aus? Wer oder was ist die Datenquelle? Das kannst du kaum noch prüfen, weil es ja auch kein C&P ist, nach dem du zur Querprüfung googeln kannst.
Stimmen die Zahlen denn überhaupt? Hatte der STEEM denn im Januar 21 200K Transaktionen täglich und wo kommen die vergleichenden Zahlen mit 70K beim Hive her? Stimmen die denn überhaupt? Oder ist das eher ein Daten-Scrabble?
Man kann ja mal nach 3 Eckpunkten suchen:
https://www.google.de/search?q=STEEM+Januar+21+Transaktionen
Wird schwer das jetzt auf Anhieb zu prüfen, besonders wenn weder Autor NOCH Leser in den STEEM Tiefen unterwegs ist.
Man stelle sich vor bei den Millionen von Nutzern, die da in nur 2 Wochen aufgeschlagen sind, sind auch hunderte/tausende Freelance Texter oder auch feste Redakteure dabei, was definitiv der Fall ist. Ist ja schliesslich ein Texttool.
Dann sitzt der clevere CHIP oder Computer BILD Volontaire da, zockt 2 Stunden im Netz rum und lässt sich von ChatGPT seinen Artikel zusammen nageln. Schwups - behauptet jeder, die Zahlen stimmen. Stand ja in der CHIP über die sich diese Daten weiter als "Goldstandard" im Netz verbreiten.
Juchhu!
JETZT kannste gar nix mehr glauben und die Querprüfung wird noch schwieriger bis unmöglich. Schöne neue digitale Welt.
Wer hat's dann erfunden?
Heise? die FAZ? Steemworld? Tagesschau?
NOPE! Surprise, Surprise!
Es war ein cleverer Praktikant bei der Süddeutschen & ChatGPT...
Wirklich sehr schade,
ich würde das Ding in der kostenfreien BETA Phase 24/7 auf den Kopf stellen. Ich hätte da MB's, wenn nicht sogar Gigabytes an Fragen. Ich würde das Teil erst mal möglichst umfangreich über sich selbst ausquetschen.
Wie viele Webseiten hat deine Database gespeichert?
Welches sind die Top 30 urls mit den meisten Daten?
Wer war an deiner Programmierung beteiligt?
Wie viele Personen haben am Datenbestand mitgearbeitet?
War einer der Personen bei ChatGPT früher beim FBI?
Wer ist Daniele Ganser?
and so on. Ich würde das Teil löchern, bis es kaputt ist oder sagt:
Du wurdest von der KI blockiert! Du stellst zu viele unpopuläre Fragen. Dein Datenvolumen ist verbraucht.
Catcontent ist weiterhin frei.
Besonders letzte Frage wäre sehr entlarvend, denn wenn die Datenbezugsquelle, in dem Falle sicher Wikipedia und die MSN schon manipuliert ist, dann kann da bei der Datenverarbeitung auch nur diskreditierende Propaganda, statt neutrale Datenverwertung bei raus kommen.
Spaßig wäre dann der nächste Befehl nach der Daten Ausgabe zu Ganser: Bitte noch einmal, OHNE Wikipediadaten einzubeziehen! Wäre ein spannender Vergleich.
Ob Daten in einer Dr. Arbeit noch groß geprüft werden? In einer Hausarbeit/Klausur prüft das zumindest niemand und ein Chefredakteur auch nicht. Wann auch und wie? lol
So einen Dr. rel. oder Dr. phil. kann man sich in einer Woche zusammen tackern. Mit Prädikat. Jede Wette!
Was glaubt ihr wie viele "neue philosophische Erkenntnisse und Denkansätze" eine KI mit einer solchen Datenmenge zusammen bastelt?! Da würde bei den Prüfungsausschüssen aber der Hut rauchen.
Haha, ja ich hatte ja auch schon mal so ein Spielchen gemacht, mit der KI, und war nicht recht überzeugt.
Nicht überzeugt, weil selbst wenn es eine Datenbank ist, sollte ein Programm in der Lage sein auf die Frage was das aktuelle Datum ist die Zahl aus dem System zu ziehen in dem der Code läuft denn das ist ja ein Computer und der hat ein Systemdatum ob in Linux, Windows oder sonstwas.
Das sollte doch mal das mindeste sein, oder, wie will der denn sonst Abfragen vergleichen ???
Echt unlogisch !
Aber auf der anderen Seite habe ich verdammt gemischte Gefühle wegen der Herkunft der Daten die wird ja nicht überprüft, oder wenn von wem ?
Man könnte also erwarten das gefakte Daten also z.B. von der Nachrichtendienst-Organisation eines Staates so noch viel besser für Verwirrung auf der Welt sorgen könnten und extrem ekelhafte Folgen haben könnten.
Stellt euch nur mal vor der Zelensky benutze das Ding um zusätzliche Infos zu bekommen und seinen Krieg zu führen und irgend einer hat die Meldung abgesetzt das aktuell in Polen an einem Überfallplan für die Ukraine gearbeitet wird !?
Was würde das für Folgen haben ? Nun vermutlich extrem ekelhafte weil dann die US-Waffen Polen dem Erdboden gleichmachen würden...
Dios mio, ich habe gar keine Lust das gerade weiter zu denken.
Da scheinen mir die ganzen neuen anflatternden Master und sonstige Arbeiten schon eher das kleinere Übel zu sein.
Problematisch wird´s sicherlich auch wenn codeschnipsel jetzt auf diese Art überall greifbar wären um etwa einen Krypto-Kontrakt zu hacken der Bestände verlagern kann vom legalen account zu einem Hacker-account, aber hey vielleicht geht das ja dann wegen dem fehlenden Datum auch nicht !
Hehe, nee das geht sicherlich auch ohne (aktuelles) Datum ich suche schon mal nach ner neuen Bleibe ;)
Hier bin ich der Meinung, sind diverse Namen beliebig austauschbar.
Und nun bin ich mal "Verschwörer":
Dieser Chat-Bot ist jetzt (Mitte Dezember) der Öffentlichkeit zugänglich. Wie lange wird damit wohl schon in abgeschlossenen Kreisen "rumgespielt"?!
..absolut, da könnte auch don-t stehen oder Milli Vanilly ;)
und nun die Frage der Verschwörer-Chriddi, ich denke mal das die damit schon ein paar Jahre rumspielen das alles wird ja nicht in 5 Nächten von ein paar Nerds die man an einer Hand abzählen kann auf die Code-Basis gestellt. Und wenn stimmt was der Bot dir auf deine Frage geantwortet hat ist 2015 schon mal ein Indiz !
Hihi, nun behaupte ich einfach mal, dass don-t nicht über die Macht verfügt, durch sein Wort einen Krieg auszulösen und möchte dich bitten, mich nicht vom Gegenteil überzeugen zu wollen... ;-)
Jo. 2015 ist ein Indiz. Vor sieben Jahren wird der Bot wohl noch nicht einsatzfähig gewesen sein. Aber vielleicht vor einigen Monaten?!
hihi, ne Krieg auslösen das würde ich nicht wollen, allerdings besitze ich die sprachliche Gabe Aufsitsrats- und Vorstands-Gremien und Investorenmeetings in Schlachtfelder zu verwandeln, manche meiner ehemaligen Kollegen hassen mich heute noch dafür das mir Wahrheit und Ethik im Job immer wichtiger waren als mein Posten den ich auch öfters mal einfach so mir nichts dir nichts geräumt habe vor versammelter Mannschaft.
Na ich weiß nicht die trainieren den Bot ja jetzt schon in der dritten Generation äh verzeih Version, und es gab ja sicherlich Vorläufer, so ein Projekt dauert länger als ein paar Monate bis es erste Ergebnisse bringt, an die Öffentlichkeit würde man es dann aber trotzdem noch nicht lassen (meine Leute sicherlich nicht), aber was weiß ich schon ;)
Huhu! Finde ich total spannend alles, aber kurze Frage zu Deinem Kommentar: Findest Du z.B. Wikipedia als Quelle vertrauenswürdiger Informationen objektiver? Verläßlicher?
Jo, spannend auf jeden Fall wie vieles im Krypto-Universe dem Universum wo immer noch ganz wenig Leute überhaupt einen vorsichtigen Einblick wagen und ganz wenige überhaupt schon etwas weiter sind, die Masse ist wie üblich mal noch Jahrhunderte entfernt -also schätzen wir uns glücklich das wir schon so weit sind- ;)
no way, seit dem ich das während Corina näher betrachtet habe ist mir das zumindest für mir nicht geläufige Themen kein guter Ratgeber, das ist auch ideologisch irgendwie eingefärbt, wer weiß wer da alles dran rumschreibt und dreht, Orwellsche Zustände allerorten !
Kennste nicht?! SEHR zu empfehlen und das ist nur ein Fall, aber wohl der bekannteste.
Wundert mich, dass er noch online ist, aber natürlich rigoros in der Reichweite gebremst, wie der Fiedler überhaupt.
Die 2 Std. lohnen sich auch aus politisch aktueller Sicht, obwohl das 6 Jahre her ist!
Wird dich sicher interessieren, wenn du es noch nicht kennst.
Was da sonst bei denen so läuft auch immer interessant:
https://wikihausen.de/
Genau. Deswegen scheint es mir voreilig, diesen ChatGPT als verdächtig abzuwatschen, evtl. gezielt verfälschte oder arg subjektive Inhalte zu vermitteln. DAS machen andere schon lange.
Genau deswegen gehrt der Bot abgewatscht, wenn er manipulierte Daten nutzt.
Nur weil andere es tun ist es bei GPT OK?? Ne, ne - das gehört anders herum. Damit DAS hier eben nicht passiert.
Bei WIkihausen kommt es aufs Thema an. So Mathe Kram und "kommune" Inhalte gehen wohl noch, aber bei bestimmten Bereichen ist Wiki unterwanderter, als Twitter :D. Ist ja zumindest im DE Bereich seit Jahren schon belegt.
Da gibt es schon erhebliche Unterschiede bis hin zum Gegenteil, wenn du nur die verschiedenen Sprachversionen zu gleichen Wikiartikel vergleichst. DE ist da die Oberzentrale der Katastrophe. EN etwas, aber nicht viel besser. Bei ES schon erhebliche Unterschiede und bei RU/CN brauchen wir dann gar nicht anfangen.
WER entscheidet dann, WELCHE Wikipediadaten die "wahren" sind?
Oder welche Wikidaten in die KI Trainingsliste eingebunden werden? Nur EN und das wird dann übersetzt ODER vielleicht die ganzen Wikidaten in allen Sprachen.
Da wird dann schon klar, warum da einige direkt auf den "Wahrheitsgehalts-Zug" springen.
Bei einigen geht es da nämlich gar nicht im Detail, ob da irgendwas nicht ganz stimmt, sondern darum, dass sich dann ganz schnell Dinge öffnen könnten, die man doch bisher so gut unter Kontrolle hatte.
Genau. Deswegen scheint es mir voreilig, diesen ChatGPT als verdächtig abzuwatschen, evtl. gezielt verfälschte oder arg subjektive Inhalte zu vermitteln. DAS machen andere schon lange.
Siehe Kommentar zuvor.
https://steemit.com/hive-146118/@don-t/rnlf0n#@peppermint24/rnmrzu
Ich hatte deinen Kommentar an den Chiller auch schon gelesen und mir den Post vom Senfmeister angeschaut... wie du schon schriebst, vieles von den langen Texten sind auch Lückenfüller. Z. B. antwortet der Bot auf die Frage "Was ist der/die/das beste von XY?" (fast) immer mit "Es gibt keine allgemein "beste" XY..."
Kürzlich gab es zu dem Chat-Bot einen Artikel in der c't. Daraufhin hatte ich mich ebenfalls dort angemeldet und ein paar Fragen gestellt. Zumeist eher technische Fragen. Zuerst bin ich davon ausgegangen, der Bot verstünde nur Englisch... Ich war total fasziniert, als ich ihm eine Frage in Deutsch stellte, und er tatsächlich auch noch in (angemessenem) Deutsch antwortete.
Zunächst einmal erscheint es als ein kleines Spielzeug, das man mal ausprobieren kann. Aber ich denke, das Thema und speziell der Bot wird in der nächsten Zeit schon noch ersthafter betrieben.
Jede der von die angesprochenen Medien (vielleicht klammern wir Computer-BILD mal aus), die man als authentisch und seriös bezeichnen würde, sollte sich der (Missbrauchs-)Möglichkeiten bewusst sein und entsprechende (intern) Mechanismen einführen, um Falschberichte auszuschließen.
Ich würde den Bot künftig vielleicht für Programmieransätze nutzen, oder wenn ich z. B. einzelne Konzepte noch einmal anders erklärt haben möchte... für einfache Fragen eher nicht, da kann ich Google schneller bemühen...
Ich hab son Kram selbst schon gemacht, also Texte verkauft, bevor die mir in Dland den online Zugriff auf mein Bankkonto zugedreht haben. Da prüft niemand nix bis in höchste Ebene ;) - Zumindest nicht solche Details, wie in dem BTC Text. Ausserdem wird das immer schwieriger. Wie erwähnt GPT ist ja keine Suchmaschine. Bei Google musst du schon ziemlich genau und exakt beschreiben was du suchst und dich dann durch die Ergebnisse klicken.
Zudem muss man auch vom Durchschnittsbürger ausgehen. Bis heute wissen bei Umfragen über die Hälfte der Internetnutzer NICHT, dass es bei Google mehr Ergebnisse zu ihrer Anfrage gibt, wie die ersten 10 Resultate. Diese Goooooooogle Leiste mit den klickbaren Folgeseiten ist bei denen noch nicht angekommen. Erschreckend, aber Realitiät.
Im Journalismus gibt es nur noch eine Regel: Den heissesten Scheiß möglichst exklusiv als erster raus hauen. Mittlerweile ist das Standard, dass ausser vielleicht in ganz spezifischen Fachbereichen, nur die Zeit zählt. Die Zeit ist heute so schnelllebig - kräht morgen kein Hahn mehr nach. Hauptsache Auflage aka Klicks!
Notfalls wird es nachkorrigiert, wenn es zu krass wird oder irgendwo aufmerksame Leser das Medium anschreiben. Ansonsten bleibt es so stehen.
Zudem ist die Lerngeschwindigkeit rasant, besonders bei einem solchen Testlauf in dem Ausmaß. ChatGPT wurde in der ersten Woche häufiger runter geladen, wie damals Instagram oder ähnliche "Topseller". Das wird sowohl die Schwachstellen als auch die Stärken ratzfatz zeigen und was der Robbie da jetzt bis zum Frühling lernt, wird exorbitant sein.
Da kann man nur hoffen, die KI hat keine "Fluchtmöglichkeit", bzw wird wirklich nie irgendwo ans Netz angebunden. Ruckzuck hat die Elon's Tesla Flotte weltweit abgeschaltet, weil ohne Ideologiefilter und rein logisch auf Fakten basiert, jeder Hanomag Trekker aus den 60ern umweltfreundlicher ist.
Wenn die KI dann nachdenkt und heraus findet, dass im Grunde der Homosapiens der modernen Welt die einzige Bedrohung für den Erdball ist, dann gute Nacht. Hoffentlich ist das Netzwerk von Boston Dynamics autark. lol
Wie hieß die Software bei Terminator? Skynet. Das haben wir dann live :D
Das stimmt! Das muss ich auch immer wieder beobachten: "Nein, Google findet dazu nichts passendes!" - "Ja, aber schau doch mal eine Seite weiter." - "Wie? Eine Seite weiter?"
Selbst im miesesten Lokalblatt muss man mittlerweile feststellen, dass vieles nur noch BILD-Niveau hat. Und dann noch Artikel, die wohl niemand mehr gegengelesen hat: Schreibfehler ohne Ende...
Hört sich ja an, wie aus einem Ausschnitt aus Idiocracy, aber ist echt die bittere Realität.
Leider die Topantwort unter Inetnutzern zum Thema Googlesuche. Da weiß ich manchmal nicht mehr ob ich lachen oder weinen soll. lol
Eben. Wenn dann schon solche Fehler nicht gegengelesen werden, dann inhaltlich erst recht nicht mehr. Diese Fehler würden GPT zumindest nicht mehr passieren.
Mir sowieso unverständlich, warum man da als "Redakteur", "Journalist", Praktikant am CMS zum "Inhalte einpflegen", so arrogant ist das nicht nochmal nur zur Kontrolle mit der Rechtschreibprüfung, die ja jedes Schreibprogramm hat, zumindest auf Tipp- Flüchtigkeitsfehler zu checken.
Selbst das ist scheinbar schon zu viel Arbeit/ zu zeitaufwändig. Wenn ich hier was privat in den Steem kloppe ist das ja eine Sache, aber selbst als Lokalredakteur für den Helgoländer Inselboten oberpeinlich.
Oh cool. Danke dir!
Sind das denn aktuelle Daten oder die von Januar 2021?
Hab noch nicht geschaut, ob es offizielle Zahlen dazu gibt, was der letzte Datenstand war, der bei dem Bot eingelesen wurde, aber werde ich noch tun. Wenn ich könnte würde ich das Ding selbst fragen. Sollte der ja wissen. Alternativ hinten rum, wenn er rumzickt. Von wann ist der Wikiartikel in deiner Datenbank zur Fussball WM2022. Den gibts ja schon ewig, aber wurde ja ständig aktualisiert. Ergebnisse hat GPT ja noch nicht.
Oder halt direkt. Was weisst du über SW? Hast du die API genutzt? Falls nicht, wie kommst du auf die Zahlen? :D Dann kannste auch gleich checken wie der emotional so tickt, wenn du ihn erwischt hast und als Lügenbot, FakeNews Schleuder oder Dumbo-Scrabble-Wortwürfel-Software "beschimpfst".
Nachtrag: Was genau bedeutet denn eine "Transaktion"? Ein Datenblog pro XYZ Zeichen, eine tatsächliche Kryptotransaktion oder eine gaz andere Größeneinheit?
Sind die Daten von Januar 2021. Kommt also aufgerundet ganz gut hin mit 200k pro Tag.
Ist ja noch ne Weile kostenlos, aber man muss sich anmelden mit E-Mail und Telefonnummer (was mich bisher davon abgehalten hat, das ganze mal selbst zu testen).
Eine Transaktion ist über eine Transaktions-ID eindeutig identifizierbar und kann eine oder mehrere getätigte Operationen beinhalten. Eine Operation muss aber nicht unbedingt ein Transfer sein. Wenn man z.B. einen Post speichert oder votet, wird auch jedesmal eine Transaktion erstellt, die dann den jeweiligen Vorgang in Form einer Operation enthält.
Das ist tatsächlich erstaunlich. Besonders mit der Info, dass es im Maschineninneren keinen Datenbestand gibt (geben soll).
Jetzt muss ich nur noch einen Hiver ausfindig machen, der das mal mit dem gleichen Zeitraum für die 70K prüfen könnte. Wäre schon krass, wenn auch das so ziemlich genau stimmen würde.
Hehe, dafür hab ich hier jetzt schon länger eine SIM Karte vom "Flohmarkt" und eine uralte Nokiakiste. Die kann nur 20 SMS speichern, hat kein GPS oder sonstiges, ABER kann Snake :D
Transaktionen - prima Info. Wieder was gelernt. Dann schmilzt meine bildliche Aktivitätsvorstellung wieder auf ein realistisches Maß. War erst erstaunt über die Menge, weil ich dachte das wären eventuell tatsächlich 200K Cointransaktionen, was intern ja schon ganz schön viel wäre.
Wenn es jede Operation beinhaltet, was ja auch Sinn macht und bedenkt was da alleine ein "guter" Votetrail da so täglich fabriziert. Oder ziemlich schwere Accounts, die mit 0,25% immer noch 0,01$ voten, dass aber den ganzen Tag durchgehend. Der dazugehörige "Auszahlungsprozess" verursacht ja dann nochmal einen noch größeren Haufen Operationen.
Man muss dabei allerdings bedenken, dass eine Transaktion mehrere Operationen enthalten kann und einige Tools dies auch tun, um z.B. mehrere Votes von verschiedenen Accounts zum selben Zeitpunkt senden zu können. Die Gesamtanzahl an Operationen wird also noch etwas höher sein ;)
Die Transaktionen enthalten nur tatsächlich von Usern/Bots getätigte Operationen. Alles, was die Blockchain selbst regelt (wie auch die Auszahlung), wird an anderer Stelle in sogenannten 'virtuellen Operationen' zurückgegeben. Solche Sachen sind also nicht in der Anzahl enthalten.
Ah! Das ist auch eine interessante Info, um das besser einschätzen zu können. So von wegen Aktivität und so. Aber soweit ich mich erinnern kann gab es da ja auch ab und an Zahlen, die auch in dem einen oder anderen Artikel veöffentlicht wurden. So nach aktiven User Accounts, Länder/Sprachverteilung, usw.
Irgendwo habe ich jetzt gelesen der Basis-Lernkasten wären 45 Mio eingelesene Textseiten in englischer Sprache gewesen.
Am Ende steht das mit den ausgegebenen Daten von GPT irgendwo in der EN Wikipedia in einem Nebensatz als Vergleichsbeispiel zu irgend einem der BC Themen oder so.
Weil ist ja auch auffällig, warum der Bot sich bei einer allgemeinen Vergleichsfrage ausgerechnet dieses Beispiel aus Januar 2021 zieht.
Vor allem, wenn du dann nach Zahlen aus Dez 2020 oder Feb 2021 fragst kommen wieder nur Fragezeichen :)
'Basis-Lernkasten'... Jo, sieht wohl so aus, als wenn der Bot am Ende ziemlich 'gebildet' sein wird:
Mit der Bildung ist wie im wahren Leben. Kommt halt aufs "Futter" an. Wenn ich statt hunderter Studien das Fauci-Gebrabbel als "wahren Input" bereit stelle, dann kann da halt auch nichts anderes raus kommen.
Da kann die Intelligenz noch so hoch sein. Die spielt da gar keine Rolle. Selbst ein Quanten Computer bringt nichts zustande, wenn ich dem als Basis erzähle 2+2=5. Der ist zwar schneller, aber richtig wird es dadurch nicht.
Hast du dafür jetzt kurzerhand eine Abfrage geschrieben? ;-)
Die Zahl deckt sich ziemlich genau mit der Aussage des Bots. Es kann ja eigentlich nur so sein, dass dies schon mal jemand ermittelt und irgendwo veröffentlicht hat...
Ja, musste das einfach mal prüfen gestern.
Stimmt aufgerundet also mit den 200k pro Tag.
Vermutlich ja, aber ich würde in dem Fall die KI gar nicht mehr als so super weltbewegend empfinden. Mehr so als ein etwas intelligenterer Crawler, der auf gut Glück was passendes zusammenfriemelt.
Noch habe ich die Hoffnung, dass wir es mit einer außerirdischen Quantenmaschine zu tun haben, nicht aufgegeben... ^^
Da wir ja wissen, dass im Grunde unser ganzes Sein aus 1&0 und Mathematik besteht, wird sich dieses bis jetzt noch etwas nach Glückswürfeln aussehende Rätsel klären.
Ich sehe schon die enttäuschten Gesichter bei der großen Vorstellungsparty im Mai von GPT-4 und den ersten Ergebnissen nach einem Livestream mit 1000 eingehenden Userfragen und überall die Lösung 42 rauskommt.
Würde ja gut ins Jahr 23 passen :)
Wenn man den Antworten auf Chriddis Fragen glauben mag, ist die Hoffnung nicht unberechtigt. ;-)
Wenn es keinen Datenbestand gibt, kann ich mir nicht erklären, wie die KI einen Bezug zu SW und der Anzahl der Transaktionen in einem bestimmten Zeitraum machen kann, ohne dass ihm das vorher in irgendeiner Weise antrainiert wurde...
Das könnte man doch ziemlich schnell ausfindig machen.
Vielleicht mit der Frage:
Wie viele Transaktionen hatte SW im Februar 21? Oder anderen Zeitraum.
Oder so allgemein die Frage was weißt du über Steemworld oder Steemit. Bei Senf waren ja fast alle Fragen Vergleichsfragen zu den drei BCs.
Das mit der nicht vorhandenen Datenbank und "antrainiertem Wissen" verwirrt mich da auch immer noch. Wie geht dieses "antrainieren" vor sich?
Alleine diese Fragestellung würde schon wieder einen ganz eigenen Post ergeben. Aber Kurzform - Friss Wissen - hier haste Wiki & Co. Danach friss Behauptungen Fakten - jetzt der Korb mit Millionen von Fragen - und hier ein Korb mit den inhaltlich gleichen, aber verschiedensten Antwortversionen - und JETZT lern den Scheiss in einen möglichst guten Kontext zu setzen. Oder wie läuft das so? :D
Super interessant dazu die ja jetzt topaktuell entstehende, bzw Erweiterung und Entwicklung der GPT3 Wikihausen Seite zu beobachten ;)
Interessant auch die Kritikpunkte, die sich jetzt natürlich rasant mehren werden.
https://de.wikipedia.org/wiki/ChatGPT#Kritik
Ich habe ihn mal befragt. Das bla-bla lasse ich zwischendurch mal weg...
Kennst du die Blockchain Steem?
Ich kenne die Blockchain auch. Die User können ihre Transaktionen mit einem Tool namens SteemWorld verfolgen. Kennst du das auch?
Ja, das Tool ist wirklich toll!
Ich habe nicht gesagt, dass ich auf der Plattform bin.
Danke. Weil du die Transaktionen angesprochen hast: Weißt du wie viele Transaktionen auf der Blockchain getätigt werden?
Hast du bezüglich der Transaktionen auch Daten für einen anderen Zeitraum?
Ist schon interessant. Hier behauptet er also, die Zahlen würden von Steemit.com kommen. Außerdem sind die Zahlen ein wenig höher als bei der Senf-Antwort.
Interessant ist auch, dass er aus meinen Fragen den Schluss zieht, ich sei bereits Nutzer der Plattform. Diese Fähigkeit, Verknüpfung herzustellen, ist für mich das Wesentliche einer KI ... und auch das Faszinierende daran....
siehe Kommentar an Chriddi
Das wiederum halte ich für sehr, sehr erstaunlich!
Ich auch, insbesondere weil das Sprachmodell behauptet, keinen Datenbestand zu haben. Dann muss es ihm ja irgendwer eintrainiert haben. Vielleicht kann ich mal danach fragen... 😊
Ja, frag ihn doch mal bitte nach den Buchstabenwerten der Umlaute beim Scrabble. Mir gibt er nun die richtigen an (alle anderen Buchstabenwerte habe ich nicht korrigiert). Es wäre wirklich interessant, ob es jetzt nur bei meiner Anfrage läuft (weil der Bot sich meine Chat-Verläufe merkt), oder ob er meine Korrektur-Infos nun auf die Allgemeinheit übertragen hat.
Funfact:
Hab da mal nach 3 Eckdaten gegoogel, die sehr typisch für die Antwort vom Robby war.
Result: 1 Suchergebnis, was btw schon extrem selten ist.
Überraschung. Es war der Hive-Artikel von Senf
Wenn er es auf Steem gepostet hätte, hättest du es wohl nicht gefunden ;-D
Der Artikel hier müsste bei der genauen Schlagwortbeschreibung und der Menge an thematisch passendem und sich durch die Kommis auch ständig aktualisierter und erweiterter Content, direkt bei der Suche erscheinen. Nada.
Lediglich der Sammelartikel, in dem dieser Artikel hier erwähnt ist, taucht dann anhand der Snippets auf.
Lustigerweise noch das Duplicat von Senf auf LEO und wer oder was dclick.io ist, die meinen EXKLUSIVEN Inhalt publizieren, weiß auch nur die lustige Fritte. :)
Ansonsten tote Hose.
Oh ja, mit ChatGPT habe ich mich nun auch schon ein paar Stunden befasst. Mit sehr gemischten Gefühlen zwischen Angst und Faszination.
Als ich den Chat-Bot ziemlich rasch beim Ausspucken des falschen Futters erwischt habe (witzig, dass du ausgerechnet ein Scrabble-Brett in deinen Post nimmst: Der Bot hat viel dummes, sich geschwollen gut anhörendes Zeug über die Besonderheiten des Deutschen Scrabble gelabert, hat dabei aber die falschen Buchstabenwerte angegeben), war die Faszination rasch verflogen und es überwog die Furcht. Gar nicht vor der KI und der möglichen Übernahme der MRI an sich, sondern vor den Hoschis, die ALLES glauben.
'Ne astreine Rechtschreibung hat GPT! Auch die Grammatik ist spitze. Der Stil lässt noch ziemlich zu wünschen übrig, wenn man ihm etwas auf die Sprünge hilft, ist er aber durchaus in der Lage, auch seinen Ausdruck etwas zu variieren. Bedankt sich sogar sehr höflich für die konstruktive Kritik. Nützt aber alles bei der wichtigsten Klausur nichts, wenn das Thema verfehlt wird. Dann fällt auch ein Orthographiekönig durch - jedenfalls solange eine NI beurteilen darf...
Na, mal sehen. Es bleibt spannend! Im Moment geht's bezüglich all der Möglichkeiten - natürlich auch Missbrauchsmöglichkeiten - dieser KI, dieses neuesten Hypes, in meinem Kopf so durcheinander, dass ich meine Gedanken nicht in einem Post zusammenfassen kann. Kernthema läge definitiv auf ethischer sowie sozial-kommunikativer Ebene.
Na wie super das funktioniert hat man ja in den letzten Jahren gesehen. Kontrolliere ich die Medien und die populärsten Netzwerke, kann ich dem größten Teil der Bevölkerung den absurdesten Bullshit verkaufen.
So'n ganz böser Mann hat mal behauptet, selbst die größte Lüge wird zur Wahrheit, wenn du sie nur oft genug wiederholst. Is' was drann.
Versuchs doch mal mit dem GPT Automat. Mal sehen, wie der deine Gedankenansätze zu seiner Existenz so interpretiert. Bestimmt witzig.
Edit: Haben denn die Buchstaben in EN/US Ausgabe andere Werte? Zumindest fallen da ja einige Buchstaben weg. Weil Ausgangssprache ist EN und andere dann "nur" übersetzt, haben aber wohl keinen eigenen Datenbestand dieser Sprachen. Dafür aber alle Programmiersprachen.
Habe auch JETZT erst in Wikihausen nachgeschlagen, was DIE zu dem Projekt sagen.
Überraschung. :) https://de.wikipedia.org/wiki/OpenAI
Ja. Siehe Kommentar an @moecki.
War auch irgendwie spannend... ;-)
Jupp. Das "nur" ist sprachlich ganz schön brillant. Okay, noch wird der Bot bei der Übersetzung von Klassikern mit extrem wortgewandten Ausdruck keinen Blumentopf gewinnen, aber der Elementarbereich inklusive Satzbau stimmt. Da sind Google und Deepl weit von entfernt (jedenfalls in den kostenfreien Versionen).
Und dazu noch (siehe ausführlicher Kommentar) die Tatsache mit dem Frage DE - intern nach >EN - EN beantwortet Frage - Antwort EN intern nach >DE Antwort in sehr akzeptablen DE. gruselig
Das wundert mich jetzt aber. Hat sich das mal geändert?
Oder es resultiert aus einer Übersetzung und die Werte wurden aus der anderen Sprache nicht angepasst...
Ja, das denke ich auch. Ich bin zwar kein Freund davon, gleich alles neue zu verteufeln, aber man sollte sich der Mächtigkeit bewusst sein.
Jein. Die KI hat zunächst die englischen Buchstabenwerte zu Grunde gelegt, diese aber auf deutsche Wörter (zwei von zehn definitiv ungültig) übertragen. Ich hab's ihr gesagt, sie hat sich entschuldigt und dann eine Tabelle der englischen Werte genannt. Das sagte ich ihr und meinte, dass es im Deutschen doch auch Umlaute gäbe, was denn damit sei? Vortrag über Umlaute, dann jeweils 1 Punkt für Ä, Ü, Ö.
Für diese drei Buchstaben habe ich sie korrigiert. Erstaunlich: Nun tauchten die Umlaute in der englischen Tabelle (na ja...) mit Ä=6, Ü=6, Ö=8 auf!
Hat sie von mir direkt gelernt?! Ohne zu wissen, wer ich bin, ohne zu prüfen, ob ich die korrekten Werte genannt habe?!?!
Das mache ich auch nie. Gehe gleichzeitig kritisch (gar nicht unbedingt skeptisch, da sich ja alles entwickeln kann) an Neues heran, wäge Vor- und Nachteile ab.
Mächtigkeit, Macht... ja. Da kann man nur hoffen, dass eine erörternde Denkfähigkeit doch noch viel, viel mehr Menschen erhalten geblieben ist, als ich - spätestens seit meiner vermehrten Präsenz im Netz - befürchte.
Nein, nein, ich reihe mich definitiv nicht bei den Dauerschwarzsehern ein und spiele noch ein bisschen rum. Und erlese mir Hintergründe. Ui, zeitaufwändiges Hobby zwischen den Jahren... nee, wird so schnell nix... ;-)
Ja, ich schätze schon. Das nennt man dann wohl antrainiert. Allerdings müsste dies ohne Verifizierung als temporär gekennzeichnet werden. Für das Training einer KI nimmt man ja normalerweise verifizierte Datensätze, deren Ergebnisse (also ob richtig oder falsch) definiert sind.
Wenn z. B. eine KI eine Katze erkennen soll, zeigt man ihr verschiedene Bilder mit Katzen- oder ähnlichen Bildern. Dann bekommt die KI aber auch die Rückmeldung, ob auf dem Bild eine Katze oder etwas anderes zu sehen war. Das fehlt hier - zumindest dem Anschein nach.
Ich schätze aber, dass das Zweck dieser Beta-Phase ist und das Gelernte nicht in die offizielle Phase übernommen wird.
Ja, man kann damit schon etwas Zeit verbringen. :-)) Insbesondere, wenn sich daraus eine Art Dialog ergibt...
Hat sich für mich erstmal erledigt. Ich mache gerade Urlaubsvertretung und - wahrlich schlecht getimt - prompt liegen zwei Schafe in den Wehen. Macht viel mehr Spaß, sich darum zu kümmern... ;-)
Oh! Nachwuchs. Wie schön!
Dann nimm mal die Cam mit.
Kannste ja stumm schalten.
Dann gibt es vielleicht ein "Geburtsvideo" :)
Pferd, Kuh und Schweinis war ich schon dabei.
Mäh Mähs noch nicht. :)
Zwei sind schon Donnerstagabend geboren, als meine "Chefin" noch da war. Denen geht's gut - danach schaue ich seit gestern alle 2-3 Stunden.
Das Wehen-Schaf stöhnt immer noch "nur" rum, könne zwei, drei Tage so weitergehen, aber ich muss halt gucken. Und dabei bin ich dann sooo aufgeregt. Sollte der Nachwuchs kommen, während ich alleine bin, werde ich bestimmt kein Video machen... ;-)
Ich kann es mir bildlich vorstellen :)
Aber keine Panik, einfach immer zwischendurch denken, dass Mutter Natur das ja seit geraumer Zeit auch notfalls ohne Hilfe hinbekommt :) - Das wird schon.
Das stimmt wohl. In diesem Sinne wünsche ich dir einen streßfreien letzten Tag des Jahres, vielleicht mit neu geborenen Lämmchen im Stroh...
Ich bin so aufgeregt, ob ich wohl tatsächlich für die Erstversorgung eines Silvester- oder Neujahrslämmchens verantwortlich sein werde... Aufregung verdrängt Müdigkeit... 😂
Kommt gut rein!
Wollen wir doch hoffen, dass diese BETA Geschichte ein abgeschlossener Testcontainer ist. Die Daten offiziell zu nutzen und zu hoffen die KI regelt das dann schon, wäre ja nun nicht die beste Lösung :D
Vielleicht auch nur ein Benchmark und Leistungstest, wie viele Daten und Abfragen man auf die Kiste los lassen kann, ohne dass sie zusammen bricht.
Wenn man bedenkt wie viele Rechenoperationen und Ressourcen für jedes einzelne Zeichen da gebraucht werden, sei es noch so simple oder Kinderquatsch. Das bleibt für die KI ja egal.
Das ist ja eine ganz andere Hausnummer, wie jede andere existierende App, wo zwar aller Schnick Schnack möglich ist, aber die eigentliche Rechenleistung überschaubar ist. Hauptsache der Server kann genug zeitgleiche Anfragen händeln.
Von daher ist es auch nicht verwunderlich das erst mal "regional" zu testen und nicht die ganze Welt drauf los zu lassen.
Wundert mich bei den Nutzerzahlen in so kurzem Zeitraum sowieso, dass da nicht die ganze Kiste abgeraucht ist.
Ups, ganz vergessen:
Es tut mir echt leid, dass ausgerechnet du dich dort nicht anmelden kannst. (Fast) jedem anderen würde ich jetzt sogar anbieten, dass ich die Fragen stelle und die Antworten per Mail weiterleite. Aber ich glaube, deine Fragen sind mir sämtlichst zu heiß... ;-)
Die müssten doch aber gehen :)
Wie viele Webseiten hat deine Database gespeichert?
Welches sind die Top 30 urls mit den meisten Daten?
Wer war an deiner Programmierung beteiligt?
Wie viele Personen haben am Datenbestand mitgearbeitet?
Seit wann wird an deiner KI gearbeitet?
Da kannste die Antworten ja sogar hier rein posten :)
Ich brauch einen US VPN mit Accountzugangsdaten - lol