Projektowanie dla prawdy: Google Scholar Concept

Wyobraź sobie, że obudziłeś się pewnego ranka z e-mailem od ciotki, ostrzegając cię, aby nie szczepić nowonarodzonego syna. Martwisz się, otwierając link i czytając, że badanie opublikowane w The Lancet (jedno z najbardziej renomowanych czasopism naukowych na świecie) ostatecznie wykazało, że szczepionki powodują autyzm. Plik PDF rzeczywistego badania wydaje się uzasadniony, jednak brak wiedzy medycznej uniemożliwia jego zrozumienie lub łatwą dyskredytację. W końcu został opublikowany przez The Lancet, ma kilkanaście cytatów, a artykuł stanowi uzasadniony argument. Możesz zdecydować się na dalsze badania, ale niektórzy mogą być przekonani i ponownie podzielić się nim na Facebooku, aby ostrzec innych rodziców przed niebezpieczeństwami związanymi ze szczepieniem.

Tak dzieje się dezinformacja.

Omawiane badanie jest w rzeczywistości autorstwa Andrzeja Wakefielda i opublikowane w The Lancet w 1999 roku. Jednak artykuł twojej ciotki pominął to, że badanie zostało w całości wycofane w 2010 roku z powodu manipulacji danymi i licencja medyczna Wakefield została cofnięta. Incydent ten został powszechnie uznany za główny katalizator ruchu przeciwko szczepieniom, który jest odpowiedzialny za wybuchy wcześniej kontrolowanych chorób, takich jak odra i świnka, prowadzące do wielu zgonów.

Kompas prawdy

Jesteśmy w trakcie kryzysu epistemologicznego w wyniku szerzących się dezinformacji, których albo nie mamy czasu ani specjalistycznej wiedzy, aby zweryfikować. Chociaż nauka nie jest doskonała, nauka jest najlepszym narzędziem, do którego musimy dojść do prawdy, ponieważ wytwarza podstawowe fakty, na których oparte są opinie, przekonania i polityka światowa. Istnieje jednak wiele wyzwań związanych z identyfikacją wiarygodnych badań:

  1. Poza zasięgiem - żargon techniczny, gęsty tekst i częste ściany płatnicze sprawiają, że badania naukowe są praktycznie niedostępne dla mas, pozostawiając nas w tłumaczeniu przez media.
  2. Przesadzone - media często nadmiernie upraszczają i sensacjonalizują ustalenia w celu generowania przychodów z reklam, co jeszcze bardziej osłabia prawdę.
  3. Dynamiczny świat, statyczne informacje - większość opublikowanych dziś informacji jest osadzona w kamieniu, chyba że zostanie ręcznie zaktualizowana. Jest to szczególnie niebezpieczne dla nauki, ponieważ zawsze się rozwija - to, co udowodniono dzisiaj, może zostać obalone jutro i odwrotnie.
  4. Cytowanie króliczej dziury - badania często przytaczają 20–50 innych badań. Jeśli jedno z tych badań zostanie wycofane, czy nie powinno to wpłynąć na wiarygodność jakiegokolwiek cytowanego badania?
Skąd mamy wiedzieć, czy badanie w artykule zostało poprawione lub wycofane?
Jak wiarygodne jest badanie, które przytacza wycofane lub nieaktualne badania?
Czy badanie zostało opublikowane przez prywatną organizację mającą konflikt interesów?
Czy autor ma udokumentowaną historię oszustw?

Obecne wysiłki, takie jak RetractionWatch.com, śledzą wycofane dokumenty, wraz z najczęściej cytowanymi wycofaniami i tabelą liderów autorów o największej liczbie wycofań. Chociaż krok we właściwym kierunku, odwiedzanie strony za każdym razem, gdy chcesz zweryfikować badanie lub autora, jest uciążliwe i nie skaluje się.

Rozszerzenie przeglądarki Google Scholar

Być może jednym z bardziej niedocenianych projektów Google jest Google Scholar - darmowa baza danych ~ 150 milionów recenzowanych czasopism naukowych, książek, artykułów konferencyjnych, prac dyplomowych, rozpraw, a nawet opinii sądowych i patentów.

Widzę rozszerzenie przeglądarki Google Scholar, które wykrywa wycofane lub nieaktualne dokumenty, ostrzega, jeśli cytat z badania nie jest już ważny, powiadamia autorów o udokumentowanych oszustwach i powiadamia o badaniach finansowanych ze środków prywatnych w nadziei, że pomogą czytelnikom ustalić wiarygodność.

Przyjrzyjmy się wcześniej artykułowi ciotki z zainstalowanym rozszerzeniem Google Scholar:

Po otwarciu artykułu rozszerzenie przeglądarki Google Scholar ostrzega o wykryciu nieprawidłowego badania w artykule:

Kiedy zaczynasz czytać, zauważysz, że link do danego badania jest podświetlony:

Kliknięcie „Wyświetl szczegóły” lub ikonę rozszerzenia wyświetla karty informacyjne z dodatkowymi szczegółami:

Karty informacyjne składają się z 7 sekcji:

  • Ostrzeżenie (jeśli dotyczy).
  • Typ dokumentu: nazwa i link do dokumentu.
  • Wydawca: nazwa wydawcy, data, źródło
  • Autor: nazwisko, tytuł, instytucja, współautorzy,
  • Instytucja: nazwa, prywatna lub publiczna
  • Pasek informacyjny: cytowany według numeru, powiązane artykuły i pobierz (jeśli dotyczy)

Istnieją różne stany ważności dla każdego elementu interfejsu użytkownika rozszerzenia:

W przypadku wielu dokumentów ikona rozszerzenia wyświetla liczbę dokumentów o najwyższym poziomie ważności (jeśli 2 zostaną wycofane i 4 niesklasyfikowane, ikona będzie czerwona z cyfrą 2)

Linki do kart informacyjnych prowadzą do odpowiednich stron Google Scholar:

Badania

Zacząłem od zbadania, w jaki sposób rozpowszechniono informacje, i skonsultowałem się z moim doktorem. Nakreśliłem relacje między głównymi graczami w ekosystemie wiadomości naukowych:

  • Autorzy (profesorowie) prowadzą badania naukowe
  • Instytucje finansują tych autorów
  • Czasopisma Opublikuj ustalenia dotyczące jakości
  • Witryny medialne i blogi informują o tych ustaleniach
  • Czytelnicy dowiadują się o wynikach badań naukowych za pośrednictwem stron medialnych

Po pewnym kopaniu staje się oczywiste, że prawie wszyscy gracze są zachęcani do działania w interesie własnym:

  • Autorzy - cenne wyniki badań = awans zawodowy
  • Instytucje - zatrudnieni bardziej wartościowi autorzy = lepsza reputacja / $
  • Czasopisma - opublikowano cenniejsze badania = lepsza reputacja / $
  • Media - opublikowano ciekawsze badania = wygenerowano więcej pieniędzy na reklamę

Ustalenia te dodatkowo wzmacniają potrzebę takiego przedłużenia.

Następnie zmapowałem bieżącą nawigację w Google Scholar:

Następnie zaplanowałem zaplanowaną funkcjonalność i nawigację między stronami:

Przyszłe kroki

Minusem rozszerzeń przeglądarki jest to, że nie działają one na urządzeniach mobilnych. Możliwym rozwiązaniem byłaby dedykowana przeglądarka mobilna lub upieczenie funkcjonalności w Google Chrome (Android / iOS). Ponadto istnieje kilka ciekawych przyszłych możliwości:

  • Uczenie maszynowe AI może ostatecznie przeanalizować semantykę i stworzyć znaczące relacje między bazą danych Google Scholars, które mogą prowadzić do dalszego wglądu. AI może ostatecznie stać się najlepszym recenzentem i wykrywaczem BS, ponieważ ma sens w całej literaturze akademickiej poprzez wykrywanie wcześniej niezauważonych wzorców.
  • Stuknięcie w strony z publicznością, takie jak PubPeer.com, umożliwia naukowcom przeprowadzenie przeglądu po publikacji, co uwidoczniło niedociągnięcia w kilku głośnych artykułach, a nawet doprowadziło do wycofania się. Interesujące byłoby zbadanie komentarzy lub nawet głosowania przez zweryfikowanych naukowców.
  • Decentralizacja - przypuszczam, że żaden projekt nie został ukończony, dopóki nie zostanie zaangażowany blockchain… poza żartami, mogłem zobaczyć czasopismo naukowe DApp w Ethereum, które przechowuje i notarialnie badania na blockchainie. Zweryfikowani naukowcy, którzy przesyłają recenzowane badania, otrzymają nagradzane tokeny kryptograficzne za wysokiej jakości wkłady - może istnieć nawet sprytny model finansowania społecznościowego do finansowania przyszłych badań. W tym momencie Google Scholar nie należałby już do Google, ponieważ byłby to niezależna usługa, odporna na centralną kontrolę lub cenzurę.

Moja długoterminowa wizja to mechanizm prawdy, który wykracza poza naukę, obejmuje artykuły prasowe, blogi, tweety, strony, a nawet ebooki, włączając usługi takie jak FactCheck, Snopes, FiB, BS Detector i MediaBias.

Wpływ Rosji na wybory prezydenckie w USA w 2016 r. Świadczy o sile uzbrojonej informacji. W czasach, gdy media społecznościowe stały się dla wielu głównym źródłem wiadomości, wiarygodność i wiarygodność zanikły, aw wielu przypadkach wręcz zniknęły. Fałszywe informacje stały się główną siłą kształtującą nasz świat, ponieważ produkcja i rozpowszechnianie jest tańsze i łatwiejsze niż kiedykolwiek. Ta koncepcja jest tylko jednym podejściem do znacznie szerszego i złożonego problemu, ponieważ desperacko potrzebujemy narzędzi chroniących nas przed dezinformacją

PS: Kilka dni po sfinalizowaniu tego artykułu, inicjatywa Chana-Zuckerberga ogłosiła Computable Knowledge Project, którego celem jest kompleksowe połączenie i zrozumienie artykułów naukowych za pomocą sztucznej inteligencji.