Co należy wiedzieć o cytowaniach prac naukowych

Od pewnego czasu bardzo popularne stało się przytaczanie danych o cytowaniach publikacji, opartych na Science Citation Index (SCI). Niektórzy gotowi są uznać cytowania za jedyny wskaźnik wartości prac różnych uczonych. Tymczasem bezkrytyczne stosowanie danych z SCI, zwłaszcza do porównania dorobku z różnych dyscyplin, na ogółprowadzi do błędnych wniosków.

Postaram się naświetlić sprawę cytowań dość szeroko, ponieważ sprawy analizy naukometrycznej budzą duże zainteresowanie także wśród przedstawicieli środków masowego przekazu, którzy chętnie publikują wyniki różnych analiz i wskutek niewiedzy wyciągają z nich nie zawsze uzasadnione wnioski.

Niniejszy tekst jest oparty w znacznej części na moim obszernym artykule polemicznym w Nauce Polskiej (III, s. 125-139, 1994).

Zwracam też uwagę, że niedawno ukazała się praca Jana Kozłowskiego "Miejsce nauki polskiej w świecie" (Warszawa, 1994). Jest to bardzo kompetentne i wartościowe opracowanie, w którym można znaleźć wiele ważnych i ciekawych danych liczbowych. Na pracę tę będę się powoływał.

Co trzeba wiedzieć o SCI
Wady SCI jako źródła informacji naukometrycznej są znane od dawna i były wielokrotnie analizowane. Przytoczę najważniejsze:

1. SCI podaje tylko nazwisko pierwszego autora cytowanej pracy. Nazwiska drugiego, trzeciego i dalszych współautorów nie są podawane.

2. SCI faworyzuje piśmiennictwo anglojęzyczne, zwłaszcza anglosaskie.

3. SCI faworyzuje alfabet łaciński, wielkie centra nauki oraz nauki podstawowe w stosunku do stosowanych.

Ponadto, każdy korzystający z SCI powinien zdawać sobie sprawę z następujących faktów:

4. Liczba cytowań jest proporcjonalna do całkowitej liczby publikowanych prac, ta zaś jest wprost proporcjonalna do liczebności uczonych w danej dyscyplinie.

5. W różnych dyscyplinach istnieją różne zwyczaje dotyczące cytowania prac innych autorów. Różnice średniej liczby cytowań podawanych w pracach z różnych dyscyplin mogą być bardzo duże.

6. Prace przeglądowe są cytowane znacznie częściej niż inne - jest to przejaw swoistego "lenistwa" autorów, którzy wolą zacytować jeden artykuł przeglądowy zamiast wielu prac.

7. Prace mogą nie być cytowane w bibliografii, ponieważ ich wyniki stały się powszechnie znane i weszły do literatury jako twierdzenia, wzory, teorie, reakcje itp. danego autora (nikt nie cytuje pracy Einsteina, w której podał on wzór E = mc2 , chociaż wszyscy nazywają ten wzór wzorem Einsteina !).

8. Prace bywają często cytowane, ponieważ są błędne, właśnie w celu podkreślenia błędów. Niekiedy dochodzi do paradoksalnej sytuacji, że cytowania zdobywa się za erratę błędów (przykład będzie podany niżej).

9. Prace mogą być rzadko cytowane w danym okresie, ponieważ nie zostały jeszcze właściwie docenione.

10. Zestawienia cytowań w SCI są wierną kopią cytowań w oryginalnych pracach. Jeśli więc nazwisko autora zostanie w bibliografii danej pracy przekręcone, to błąd zostanie powielony w SCI. Tymczasem ortografia dłuższych nazwisk, zwłaszcza słowiańskich, fińskich, węgierskich, czy dalekowschodnich sprawia kłopoty autorom zachodnioeuropejskim i amerykańskim, którzy stanowią znaczną część wszystkich autorów prac naukowych. Dodatkowo należy też wspomnieć o zdarzających się próbach podnoszenia własnego wskaźnika osiągnięć przez autocytowania (widuje się prace, w których 90 procent cytowanych publikacji to prace autora) oraz o "kółkach wzajemnych cytowań", w których osiąga się to zbiorowo.

Z powyższego zestawienia wynika oczywisty wniosek, że tylko z wielką umiejętnością i ostrożnością można wykorzystywać SCI do oceny wkładu poszczególnych uczonych do nauki, zwłaszcza jeśli chodzi o porównywanie osiągnięć przedstawicieli różnych dyscyplin.

Cytowanie tylko pierwszego autora
Z wymienionej wady nr 1 wynika, że szanse znalezienia się w SCI zależą w znacznym stopniu od pierwszej litery nazwiska uczonego. We współczesnej nauce prace zespołowe są bardzo częste, zwłaszcza w naukach eksperymentalnych. Uczeni, których nazwiska zaczynają się na pierwsze litery alfabetu, mają zwykle znacznie większe szanse cytowania niż ich koledzy o nazwiskach zaczynających się na litery końcowe. Dzieje się tak dlatego, że najczęściej nazwiska współautorów są podawane w pracach w kolejności alfabetycznej, wobec czego ktoś o nazwisku na przykład Abacki, ma znacznie większe szanse znalezienia się na pierwszym - jedynym zauważanym przy cytowaniu w SCI - miejscu niż jego kolega o nazwisku na przykład Żyżycki!

Wykorzystałem rocznik 1988 SCI i obliczyłem, że nazwiska cytowanych tam autorów zaczynających się na litery A-B, zajmują ponad dwukrotnie więcej miejsca niż cytowani autorzy o nazwiskach na litery W-Z (Stosunek liczby zajmowanych szpalt jest 14449/7090 = 2,04).

Tymczasem liczebność potencjalnego zbioru nazwisk w znacznej mierze zależy od kraju, z którego wywodzą się autorzy i nie zawsze odpowiada takiemu stosunkowi. Przejrzałem kilka wydawnictw biograficznych, by porównać częstości występowania ludzi o różnych nazwiskach w różnych krajach czy regionach.

W wydawnictwie American Men and Women of Science stosunek liczby stron z nazwiskami na litery A i B (915) i stron z nazwiskami na litery W-Z (566) wynosi 1,62, natomiast w słowniku Wer is Wer ? Das Deutsche Who's Who wynosi on 197/112 = 1,76. Jedynie w Who is Who in Science and Engineering 1992-1993 wynosi on 2,27 i jest wyższy od podanego wyżej dla SCI. Zupełnie inaczej przedstawia się sprawa dla Polski. Odpowiedni stosunek liczby stron w wydawnictwie Kto jest kim w Polsce (Edycja 3, Warszawa 1993) wynosi 77/97 = 0,79. W Polsce zatem przeważają nazwiska zaczynające się na końcowe litery alfabetu.

Ten wniosek jest potwierdzony przez inne źródła. Sprawdziłem, na przykład, że w książce telefonicznej Warszawy i województwa warszawskiego 1992/93 litery A-B zajmują tylko 0,85 tego, co litery W-Z. Tymczasem w książce telefonicznej Hamburga odpowiedni stosunek wynosi 321/167 = 1,92.

Porównując powyższe wyniki widzimy, że w coraz częstszych obecnie pracach zbiorowych z autorami zagranicznymi polscy współautorzy o nazwiskach zaczynających się na końcowe litery alfabetu mają znacznie mniejsze szanse cytowania niż autorzy z nazwiskami na A, B i inne litery z początku alfabetu. A przecież trudno przypuścić, żeby Abaccy byli bardziej genialni niż Żyżyccy!

Sposób układania SCI faworyzuje uczonych publikujących prace bez współautorów. Zdarza się to jeszcze dość często w matematyce, fizyce teoretycznej, w chemii teoretycznej, ale jest bardzo rzadkie w eksperymentalnej biologii, chemii, fizyce, badaniach kosmicznych i innych dyscyplinach, gdzie wykonywanie doświadczeń przez pojedynczych ludzi jest niemożliwe.

Stopień skomplikowania i pracochłonność badań eksperymentalnych stale rosną i obecnie są znacznie większe niż przed dziesięciu, dwudziestu czy więcej laty. Tym zmianom towarzyszy coraz częstsze prowadzenie badań w zespołach, których liczebność nieustannie wzrasta. W celu ilustracji tego dobrze znanego faktu przytoczę liczby, jakie uzyskałem przeglądając kilkadziesiąt numerów znanego tygodnika Nature z lat 1935, 1960, 1980 i 1993/94. Otóż w 1935 roku prace mające tylko jednego autora stanowiły aż 72,7 procent wszystkich publikowanych w tym periodyku. W 1960 roku procent ten spadł do 46,2, a obecnie wynosi tylko 4,1, czyli aż 96 prac na 100 ma dwu lub więcej współautorów! W ostatnich latach zauważa się już nawet spadek procentu prac o dwóch autorach. W Nature z 1960 roku było ich 38,7, a obecnie tylko 21 procent.

Odpowiednio do tego średnia liczba autorów jednej pracy, wynosząca 1,34 w 1935 roku, wzrosła do 1,89 w 1960, do 3,01 w 1980 roku, a obecnie wynosi już 4,53. Dodam tu, że Nature publikuje przeważnie prace z nauk biologicznych i medycznych, natomiast rzadko pojawiają się tam prace z matematyki, fizyki czy nauk technicznych.

Wobec opisanego zjawiska coraz mniejsza procentowo liczba uczonych ma szanse znaleźć się na pierwszym miejscu wśród współautorów prac naukowych i wejść do SCI. Mówiąc obrazowo: spośród 2006 nazwisk autorów 443 prac przejrzanych przeze mnie w tomach 365, 366 i 367 Nature aż 1563 (78 procent) nie znajdzie się w SCI. A to stawia przed naukometrią nowe zadania, tak aby mógł być dostrzeżony i właściwie oceniony wkład do nauki nie tylko Abackich, lecz także Żyżyckich.

Zdarzają się oczywiście odstępstwa od alfabetycznego porządku autorów prac. Dzieje się tak, jeśli:

a) Wkład pracy jednego z autorów jest znacznie większy od wkładu pozostałych;

b) Gdy praca została wykonana przez mieszany zespół uczonych z kilku instytucji - wtedy najczęściej przede wszystkim porządkowane są alfabetycznie instytucje, a następnie nazwiska autorów w każdej instytucji. (W wyimaginowanym przykładzie pracy panów Adamsa i Davisa z Princeton wraz z panami Kowalskim i Malinowskim z Krakowa nazwiska autorów mogą występować w porządku: Kowalski, Malinowski, Adams i Davis, praca ta będzie powszechnie cytowana jako Kowalski i in., a w SCI znajdzie się tylko nazwisko Kowalskiego!);

c) Jeżeli członkowie zespołu badawczego zgadzają się na rotację nazwisk przy podpisywaniu prac, tak aby szanse ujrzenia swego nazwiska przy cytowaniu miał nie tylko ten, którego nazwisko zaczyna się na literę najbliższą początku alfabetu;

d) Jeśli szef zakładu czy instytutu wymaga, aby jego nazwisko zawsze występowało na pierwszym miejscu wśród autorów. Przypadki dopisywania się szefa do każdej publikacji wychodzącej z jego instytucji są niestety znane i należą do patologii nauki. Z wymienionych powodów przewaga w SCI nazwisk autorów na litery z pierwszej części alfabetu nad tymi z jego końca nie jest tak duża, jak by to wynikało z prostego zastosowania statystyki.

Przede wszystkim angielski
Niezwykle ciekawe wnioski na temat wymienionych wad SCI nr 2 i 3 można wyciągnąć z przykładów zamieszczonych w cytowanej pracy Jana Kozłowskiego. Przytacza on analizę bazy danych SCI za lata 1981-1992, obejmującej łącznie ponad 5,6 miliona zarejestrowanych publikacji i ponad 40,5 miliona cytowań. Niezależnie od zwykłej bazy SCI, wykorzystana została baza National Science Indicators, w której rejestrowane są nazwiska i narodowości nie tylko pierwszego autora, lecz także ewentualnych współautorów, aż do 16-tu. Dzięki temu można się przekonać o wkładzie do tej bazy poszczególnych dyscyplin oraz poszczególnych krajów.

W bazie tej zastosowano podział publikacji i cytowań między grupy dyscyplin, które zostały zdefiniowane jako: astrofizyka, biologia i biochemia, biologia molekularna i genetyka, chemia, ekologia i środowisko, farmakologia, fizyka, immunologia, informatyka, matematyka, materiałoznawstwo, medycyna kliniczna, nauki geologiczne, nauki inżynieryjne, nauki o roślinach i zwierzętach, nauki rolnicze, neurobiologia. Wyróżniono też osiemnastą grupę, obejmującą badania multidyscyplinarne.

Warto wiedzieć, że w klasyfikacji - z punktu widzenia liczby publikacji - bezwzględnie przodują Stany Zjednoczone, które same dostarczają około 34 procent wszystkich publikacji rejestrowanych w SCI i znacznie wyprzedzają znajdującą się na drugim miejscu Wielką Brytanię, dającą ponad czterokrotnie mniej prac. Dodając wkład USA, Wielkiej Brytanii, Australii, Nowej Zelandii i tylko połowy Kanady (uwzględnia to w zapewne przesadny sposób możliwy wkład jej francuskojęzycznych uczonych) otrzymujemy dane mówiące, że te anglojęzyczne kraje dostarczają 47 procent wszystkich prac. A przecież uczeni wielu innych krajów także publikują po angielsku. Dane te dowodzą absolutnej supremacji języka angielskiego w literaturze naukowej. Nie znam dokładnych liczb, ale sądzę, że publikacje anglojęzyczne stanowią ponad 3/4 wszystkich. Prowadzi to do przesadnego uprzywilejowania w bazie SCI cytowania publikacji anglojęzycznych.

Stwierdzenie to można udokumentować przykładami. Oto na liście krajów, pod względem liczby rejestrowanych publikacji, trzecie miejsce zajmuje Japonia, czwarte - ZSRR (wówczas jeszcze istniejący), piąte RFN, a szóste - Francja. W porównaniu z wkładem Wielkiej Brytanii rejestrowane w SCI prace z Japonii stanowią 89 procent, prace z ZSRR - 84, a prace z Francji 65 procent.

Zupełnie inaczej przedstawia się sprawa, gdy spojrzymy na listę krajów w kolejności średniej liczby cytowań jednej publikacji. Na tej liście Francja zajmuje dopiero 15 miejsce, Japonia - 16, a ZSRR dopiero 46 - na szarym końcu! Francję wyprzedzają nie tylko Wielka Brytania i RFN, lecz także Szwajcaria, Szwecja, Dania, Holandia, Kanada, Australia, Belgia, Izrael, Norwegia, Finlandia i Islandia.

A przecież trudno stąd wnioskować, że uczeni francuscy wnoszą do nauki światowej mniejszy wkład niż ich koledzy z krajów skandynawskich czy innych. Znacząco mniej liczne cytowania prac francuskich są wynikiem polityki promowania za wszelką cenę języka francuskiego. Jest to polityka samobójcza, która na dłuższą metę będzie prowadziła do dalszego zmniejszania odbioru wyników nauki francuskiej w świecie. Tymczasem jednak wielu uczonych z Francji unika publikowania po angielsku, bywały też w przeszłości i bywają nadal naciski administracyjne na publikowanie po francusku. (Warto wspomnieć choćby niedawną debatę parlamentarną nad wprowadzeniem zakazu używania angielskiego we Francji!). Uczeni anglosascy, dominujący obecnie w nauce, bardzo rzadko czytają prace publikowane po francusku i ich nie cytują. To właśnie daje efekt, o którym wspomniałem.

Podobnie można wyjaśnić niskie miejsca Japonii, a zwłaszcza ZSRR, w którym bardzo znaczna część prac musiała być publikowana po rosyjsku, co skazywało je na małą znajomość w świecie.

Okazuje się, że średnia liczba cytowań jednej publikacji amerykańskiej wynosi 10,68, jednej publikacji z Francji już tylko 6,39, a jednej publikacji z ZSRR zaledwie 1,42. Pod tym względem prace naszych wschodnich sąsiadów ustępują publikacjom z Polski, które są 2,25 razy częściej od nich cytowane (choć dwukrotnie rzadziej niż prace z Francji).

Przykłady "niedocytowania" prac z pewnych krajów stają się jeszcze bardziej wyraźne, gdy spojrzymy na dane z poszczególnych dyscyplin. Oto na przykład w dziale wyodrębnionym w SCI jako medycyna kliniczna najwięcej prac, jak w innych dyscyplinach, pochodzi z USA (ponad 490 tys). W SCI zarejestrowano siedmiokrotnie mniej prac uczonych francuskich i aż 93 razy mniej prac z Polski. Tymczasem pod względem liczby cytowań autorzy amerykańscy biją Francuzów już o czynnik 19. Różnica między Polską i Francją jest znacznie mniejsza jeśli chodzi o liczbę cytowań, ponieważ okazuje się, że jedna publikacja z Polski jest cytowana średnio 4,12 razy więcej niż francuska (3,54 razy)! Pod względem średniej liczby cytowań jednej publikacji USA jest na pierwszym miejscu, Polska na szesnastym, a Francja dopiero na osiemnastym. Ale nasi medycy publikują po angielsku, a nie po francusku. ZSRR jest w tej klasyfikacji także "poza skalą".

Trzeba też wziąć pod uwagę dobrze znany fakt, że Amerykanie znacznie rzadziej czytają naukowe periodyki wydawane w Europie niż swoje własne. Odbija się to potem na liczbie cytowań. Sami Amerykanie są tego świadomi (por. np. dyskusję w Science, 251, 22 March 1991, s. 1408-1411).

Dodatkowym efektem, który także powoduje obciążenie bazy SCI jest to, iż nie jest w nim rejestrowanych szereg czasopism naukowych, zwłaszcza nieanglojęzycznych i publikowanych w krajach bardziej odległych od centrum badań w USA i Europie Zachodniej.

Na wymienione tu fakty trudno się oburzać, trzeba jednak o nich pamiętać.

Nie wystarcza jednak samo publikowanie prac po angielsku, żeby zostać zauważonym i docenionym w nauce światowej. Jako przykład można tu przytoczyć Indie, w których angielski jest językiem publikacji i które na liście krajów uporządkowanych według całkowitej liczby publikacji zajmują wysokie dziewiąte miejsce (Polska jest na miejscu 17-tym z liczbą prac 2,7 razy mniejszą). Ale publikacje uczonych z Indii są cytowane rzadko, toteż na liście krajów pod względem całkowitej liczby cytowań Indie są dopiero na szesnastym miejscu, a na liście krajów uporządkowanych pod względem średniej liczby cytowań jednej publikacji są blisko końca, na miejscu 39-tym! (Polska jest na miejscu 32-gim - przeciętna polska publikacja jest cytowana 1,7 razy częściej niż publikacja z Indii).

Różnice między dyscyplinami
Z zestawień zawartych w opracowaniu Jana Kozłowskiego wynika, że najwięcej, bo aż 21 procent publikacji rejestrowanych w SCI, przypada na medycynę kliniczną. Na kolejnych miejscach są biologia z biochemią (13,5 procent) i chemia (13,1 procent). Ponadto osobno są klasyfikowane prace z biologii molekularnej i genetyki (4,7 procent). Prace z farmakologii stanowią 3,3 procent, a z neurobiologii 3,5 procent całości próbki rejestrowanej w SCI.

Najmniej prac zarejestrowanych w SCI jest z astrofizyki (1,1 procent) i informatyki (1,2 procent). Bardzo skromnie są też reprezentowane prace z matematyki (1,8 procent), nauk o Ziemi (2,5 procent), nauk rolniczych (3,0 procent) i nauk inżynieryjnych (5,6 procent). Przytoczyłem oczywisty fakt, że cytowań w SCI jest tym więcej, im więcej publikacji, zaś liczba tych ostatnich zależy od liczby autorów, czyli od liczebności środowiska w danej dyscyplinie. Jednak trudno tu mówić o prostej proporcjonalności liczby cytowań do liczby uczonych, albowiem w grę wchodzi szereg innych czynników. Istotnie, astrofizyków jest dużo mniej niż lekarzy, ale patrząc na przytoczone liczby, trudno uwierzyć by, na przykład, publikujących biologów było na świecie 3,3 razy więcej niż przedstawicieli nauk inżynieryjnych.

Po pierwsze, jak wykazują specjaliści, w SCI nauki podstawowe są wyraźnie faworyzowane w stosunku do nauk stosowanych. Na przykład, według źródeł brytyjskich, ponad połowa prac z nauk o Ziemi z Wielkiej Brytanii nie jest w SCI rejestrowana (Hicks i Crouch, Physics World, September 1990).

Po drugie, w różnych dyscyplinach obowiązują najwidoczniej różne zwyczaje, jeśli chodzi o cytowanie innych prac. Najczęściej cytują prace immunologowie, ponieważ dla prac z immunologii przeciętna liczba cytowań jednej publikacji wynosi aż 15,29. Bardzo często są także cytowane prace z biologii molekularnej (14,78), neurobiologii (12,26) i biologii z biochemią (11,69). Na dole klasyfikacji znajdują się właśnie nauki inżynieryjne, w których jedna publikacja jest cytowana średnio zaledwie 2,63 razy, a więc prawie sześciokrotnie rzadziej niż w immunologii. Kolejne miejsca, od dołu w tej klasyfikacji, zajmują: matematyka (2,92), informatyka (3,09) i nauki rolnicze (3,09).

Astrofizycy, będący na końcu klasyfikacji pod względem całkowitej liczby publikacji, cytują prace stosunkowo często, średnio 10,4 razy na jedną pozycję. Z tego powodu w klasyfikacji łącznej liczby cytowań zajmują 13 miejsce, wyprzedzając matematykę, informatykę, nauki rolnicze, ekologię, materiałoznawstwo i badania multidyscyplinarne. Z kolei immunologia, dla której zarejestrowano 111521 prac, niemal dokładnie tyle samo co w matematyce (111440), pod względem liczby cytowań (1705554) ponad pięciokrotnie "bije" matematykę (325585). W sumie w analizowanej bazie SCI cytowań prac z matematyki jest 30 razy mniej niż z biologii/biochemii i 24 razy mniej niż z medycyny! Na to składają się zarówno dużo mniejsza całkowita liczba prac z matematyki, jak i mniejsza średnia liczba cytowań jednej pracy.

Względny udział poszczególnych dyscyplin w światowej bazie SCI cytowań, w latach 1981-1992, najbardziej przekonywająco ilustruje zestawienie (tablica 1), w którym udział najskromniej występującej dyscypliny, informatyki, przyjęto za 1.

Tablica 1
Informatyka 1,0
Matematyka 1,4
Badania multidyscyplinarne 1,6
Nauki rolnicze 2,5
Materiałoznawstwo 2,6
Ekologia/środowisko 2,7
Astrofizyka 3,1
Nauki inżynieryjne 4,0
Nauki geologiczne 4,3
Farmakologia 6,9
Immunologia 7,5
Nauki o roślinach/zwierzętach 8,5
Neurobiologia 11,6
Biologia molekularna/genetyka 19,1
Fizyka 19,9
Chemia 21,6
Medycyna kliniczna 34,9
Biologia/biochemia 43,2

(Na podstawie danych z tablicy zamieszczonej w pracy Jana Kozłowskiego, s.15, 1994)

Z tablicy tej wynika, że na przykład jedno cytowanie pracy informatycznej ma taką samą wagę w łącznej światowej liczbie cytowań z informatyki jak 35 cytowań z medycyny lub 43 cytowania z biologii/biochemii w łącznej światowej bazie cytowań z tych dyscyplin!

Po trzecie, w różnych dyscyplinach występują zapewne także różnice wydajności uczonych, mierzonej liczbą publikacji. Ten efekt jest bardzo trudny do ilościowego ujęcia. Można jednak podejrzewać, że ogólnie częściej udaje się publikować prace uczonym zajmującym się teorią niż tym, którzy prowadzą przeważnie długie i skomplikowane badania eksperymentalne.

Na zakończenie przekonywający przykład. Znane jest zestawienie nazwisk uczonych, których prace uzyskały największą absolutną liczbę cytowań zarejestrowanych w SCI w latach 1981-1988 (Holland, The Scientist, 1 October 1990). Zestawienie zostało sporządzone poprawnie, to znaczy nazwiska autorów zostały zarejestrowane niezależnie od tego, czy w danej pracy były wymienione na pierwszym, czy na dalszych miejscach.

Otóż na pierwszym miejscu w tym zestawieniu znajduje się wirusolog i specjalista od biologii komórki R. C. Gallo, który zebrał 23232 cytowania, a więc blisko 4 tysiące rocznie. W pierwszej siedemnastce odnotowujemy wyłącznie przedstawicieli nauk biologicznych i medycznych. Zajmujący siedemnaste miejsce specjalista biologii komórki W.W. Franke zebrał już tylko 8363 cytowania, prawie trzykrotnie mniej niż Gallo.

W pierwszej setce zestawienia znajdujemy łącznie 50 przedstawicieli nauk biologicznych, 23 - nauk medycznych, 16 immunologów i 6 farmakologów. Pozostałe pięć miejsc zajmuje czterech fizyków (na miejscach 18, 34, 85 i 94) oraz jeden chemik (na miejscu 73). W tej pierwszej setce jest tylko 7 laureatów Nobla (na miejscach 13, 14, 27, 30, 48, 60 i 100). Nie znajdujemy więc żadnego przedstawiciela matematyki i informatyki, nauk o Ziemi, rolniczych, inżynieryjnych itd. A przecież trudno powiedzieć, że uczeni reprezentujący te dziedziny nie wnoszą wiele do nauki światowej.

Powyższy przykład pokazuje dowodnie, ile warte są próby klasyfikacji wkładu uczonych z różnych dyscyplin na podstawie liczby cytowań w SCI.

Inne wady SCI
Praktyka pokazuje, że prace przeglądowe są cytowane wielokrotnie częściej niż zwykłe. Jak wspomniałem, wielu autorów "z lenistwa" cytuje artykuł przeglądowy zamiast wielu publikacji. W związku z tym warto odnotować pomysł, aby każde cytowanie artykułu przeglądowego automatycznie pociągało za sobą włączenie do bazy SCI wszystkich cytowań prac w tym artykule. Alternatywne wyjście, to wyłączenie artykułów przeglądowych z bazy SCI (von Borstel, 1991).

Wspomniałem, iż pewne prace mogą być w jakimś okresie rzadko cytowane, ponieważ nie zostały jeszcze docenione. Dobrym przykładem może tu być publikacja fizyka amerykańskiego Stevena Weinberga z 1967 roku, która w pięciu latach od chwili publikacji była cytowana wszystkiego 5 razy, a więc średnio raz w roku. A przecież za tę właśnie pracę Weinberg otrzymał parę lat później nagrodę Nobla!

Pewne publikacje mogą z kolei mieć bardzo wiele cytowań, chociaż są błędne i to z tego właśnie powodu. Kiedy na wiosnę 1989 roku Martin Fleischmann i Stanley Pons opublikowali doniesienie o odkryciu "zimnej fuzji", to ich praca zebrała bardzo wiele cytowań w następnych miesiącach, chociaż szybko się okazało, że to "odkrycie" nie zostało potwierdzone (w sumie 302 cytowania do końca 1990 roku, w tym 68 cytowań erraty, w której sprostowano błąd z pierwszej pracy; można więc powiększać liczbę cytowań publikując pracę z błędami, a potem je korygując!) Obecnie sprawa "zimnej fuzji" jest nazywana "naukowym fiaskiem XX stulecia" (Huizinga, Cold Fusion: The Scientific Fiasco of the Century, 1992).

Korzystając z SCI, trzeba też pamiętać o możliwych zniekształceniach nazwisk (skopiowanych do bazy SCI za oryginalnymi publikacjami). Sam się przekonałem, że na przykład moje publikacje były cytowane pod nazwiskami Wroblewski, Wrobleski, Wroblewsky, Wroblenski, Wrobrewski, Wroblevski, Wroblewsi i Vrublevsky, nie mówiąc już o zmianie inicjałów. W tym przypadku te zniekształcenia nie były groźne, ponieważ przy przeglądaniu SCI można było wszystkie odnośniki zobaczyć na tej samej lub sąsiedniej stronie. Bywają jednak sytuacje poważniejsze. Moja koleżanka z Instytutu Fizyki Doświadczalnej, profesor Ewa Skrzypczak, kolekcjonuje wszystkie "wariacje" jej arcytrudnego dla obcokrajowców nazwiska; rekordem jest chyba "Skjipehak" - a to w SCI znacznie trudniej znaleźć.

Jak można korzystać z SCI
W świetle podanych wyżej przykładów jest oczywiste, że bezsensowne wydaje się porównywanie wkładu do nauki uczonych z różnych dyscyplin na podstawie całkowitej liczby cytowań w SCI. Korzystając z SCI, trzeba przede wszystkim zadbać o właściwe odczytanie zawartych tam cytowań. Jeśli ktoś koniecznie chce posługiwać się SCI, to powinien porównywać tylko rzeczy porównywalne, a więc wyłącznie osiągnięcia w tej samej dyscyplinie. Warto podkreślić, że porównanie jest tym uczciwsze, im węższą rozpatruje się specjalność. W dziedzinach tak obszernych, jak na przykład chemia czy fizyka, są wyraźne różnice w cytowaniach w różnych specjalnościach.

Całkowitą liczbę cytowań prac danego autora można ustalić tylko wtedy, kiedy ma się do dyspozycji pełny spis jego publikacji, z wymienieniem wszystkich współautorów, których nazwiska występują na pierwszym miejscu w pracach zespołowych (trzeba też pamiętać o możliwych zniekształceniach nazwisk przy cytowaniu!). Dopiero po takim odszukaniu wszystkich cytowań danego autora, można by porównać ich liczbę z danymi dla innych uczonych w tej samej dyscyplinie. Porównanie byłoby tym bardziej poprawne, im węższą rozpatrywano by dyscyplinę.

Nawet jednak takie wykorzystanie liczby cytowań mogłoby prowadzić do niepoprawnych wniosków, ponieważ wiadomo, iż niekiedy prace metodyczne zdobywają liczbę cytowań znacznie większą niż prace przynoszące idee rewolucjonizujące naukę. Na przykład najczęściej cytowaną publikacją wszystkich czasów jest praca metodyczna O. H. Lowry'ego z 1951 roku na temat pomiarów protein, bo aż około 50 tysięcy razy w latach 1961-1975, wielokrotnie częściej niż następna w rankingu cytowań. Jak słusznie zauważa Jan Kozłowski (1994): "Fakt, że prace Einsteina były rzadziej cytowane nie świadczy, że ich wkład do nauki był mniejszy."

Użytecznym parametrem uwzględniającym wpływ danego uczonego na naukę mógłby być procent jego publikacji, które nigdy nie zostały zacytowane. Wiadomo, że procent takich niecytowanych publikacji może być dość znaczny, chociaż silnie zależy od dyscypliny. W naukach inżynieryjnych może on przekraczać 80 procent, natomiast w fizyce atomowej i molekularnej wynosi tylko 9,2 procent (Hamilton, Science, 251, s. 1546, 1991). Obliczanie tego procentu wymagałoby jednak również konfrontacji z SCI pełnego spisu prac każdego uczonego. Także i w tym przypadku porównania wkładu różnych uczonych można by przeprowadzać tylko w zakresie wąskich dyscyplin w celu uniknięcia różnic między specjalnościami.

Istnieją jednak inne sposoby oceny wkładu uczonych do nauki. Specjaliści z danej dyscypliny bez potrzeby studiowania SCI dobrze wiedzą, kto reprezentuje wysoki poziom i wnosi znaczący wkład do nauki. Miarą uznania i pozycji uczonego w świecie nauki mogą być na przykład: zaproszenie przez komitet międzynarodowy do wygłoszenia prestiżowego referatu przeglądowego (tzw. raporterskiego) na wielkiej konferencji międzynarodowej, zaproszenie do udziału w komitecie redakcyjnym lub w gronie recenzentów prestiżowego międzynarodowego czasopisma naukowego, wyróżnienie prestiżową nagrodą międzynarodową, wybór na członka zagranicznego jakiejś prestiżowej akademii nauk, przyznanie doktoratu honorowego itd.

Wymienione przykłady znacznie gorzej poddają się wymiernej analizie naukometrycznej. Trudno przecież zdecydować, ilu cytowaniom w SCI równoważne jest członkostwo zagraniczne Royal Society, doktorat honorowy Cambridge, czy Nagroda Nobla. Byłoby jednak absurdem ograniczać ocenę uczonych tylko do liczby cytowań zarejestrowanych w SCI.

prof. Andrzej Kajetan Wróblewski


Bibliografia

  1. Beaver. D. deB., 1986, Collaboration and Teamwork in Physics, Czech. Journal of Physics, B 36, s.14.
  2. von Borstel R. C., 1991, An Analysis of Citation Analysis, Science, 251, s.1546.
  3. Hamilton D. P., 1991, Research Papers: Who's Uncited now?, Science 251, s.25.
  4. Hicks D., Crouch D., 1990, Can Bibliometrics Measure up?, Physics World, September, s.27.
  5. Holland L., 1990, Citation Superstars, The Scientist, October 1, s.18.
  6. Huizinga J. R., 1992, Cold Fusion: The Scientific Fiasco of the Century, Rochester, University Press.(por. także: Taubes G., 1993, Bad Science, The Short Life and Weird Times of Cold Fusion, New York, Random House).
  7. Kozłowski J., 1994, Miejsce nauki polskiej w świecie, Warszawa, Komitet Badań Naukowych.
  8. Lancaster F. W., 1991, Science, 251, s.1409.
  9. Nuhfer E. B., 1991, Science, 251, s.1410.
  10. Lewicka-Strzałecka A., Strzałecki A., 1993, Analiza naukometryczna prac członków Polskiej Akademii Nauk, Nauka Polska II (XXVII), s.27.
  11. Price D. J. de S., 1963, Little Science, Big Science, New York, Columbia University. Wydanie polskie: Mała nauka - wielka nauka, przekład z angielskiego Piotr Graff, Warszawa 1967, PWN.
  12. Stefaniak B., 1986, What is being published by Polish Physicists, Czech. Journal of Physics, B 36, s.148.
  13. Tainer J., 1991, Science, Citation, and Funding, Science, 251, s.1408.
  14. Vlachy J., 1986, Past and Future Proportions of Physics Subfields from Trend, Matrix, Entropy and Dispersion Analyses of Publication Output, Czech. Journal of Physics, B 36, 1986.
  15. American Men and Women of Science, 1992, New Providence, R. R. Bowker.
  16. Kto jest kim w Polsce, 1993, wyd.3, Warszawa, Interpress.
  17. Nature, 1935, vol.136; 1960, vol. 185; 1980, vol.258; 1993, vol.365 i 366; 1994, vol.367.
  18. Oficjalna książka telefoniczna Warszawy i województwa warszawskiego 1992/93, Warszawa.
  19. Science Citation Index, 1987, 1988, 1989, 1990.
  20. Telefonbuch 8 - Hamburg, 1991/92.
  21. Wer is wer? Das Deutsche Who's Who, 1993, Ltbeck, Schmidt Romhild.
  22. Who is who in Science and Engineering 1992/93, Wilmette, Marquis Who's Who.
  23. Zeitschrift für Physik B, 1989-1992, vol. 77-89; Zeitschrift für Physik C, 1988-1992, vol. 39-55.