Wie kann man bewirken, dass die eigenen Forschungsergebnisse im Internet besser gefunden werden? Dies ist wichtig für die Sichtbarkeit der eigenen Arbeit und die Zitationshäufigkeit. Jöran Beel hat diese Frage zusammen mit seinen Kollegen Bela Gipp und Erik Wilde wissenschaftlich untersucht und stellt die Ergebnisse in einem Gastbeitrag vor::

Wissenschaftler sind faszinierend. Sie investieren Wochen, Monate, ja manchmal sogar Jahre in die Erstellung eines wissenschaftlichen Artikels, zahlen oftmals Hunderte Euro um diesen Artikel dann auf einer Konferenz präsentieren zu dürfen und dann? Dann wenden sie sich dem nächsten Artikel zu, und hoffen, dass ihre alten Artikel von irgendjemandem gelesen und im Idealfall auch noch zitiert werden.

Webmaster sind da anders. Jeder, der eine Website erstellt und diese halbwegs ernsthaft betreibt, hat sich schon einmal Gedanken über „Suchmaschinenoptimierung“ gemacht. Das heißt, er hat sich die Fragen gestellt: Wird meine Webseite eigentlich von Google gefunden? Und indiziert? Und wenn jemand bei Google nach dem Stichwort XYZ sucht, steht meine Seite dann ganz oben in der Ergebnisliste? Und wenn nicht, wie kann ich das ändern? Im Internet gibt es eine riesige Community, die sich mit diesen Fragen beschäftigt (Stichwort SEO, Search Engine Optimization).

seo_blocksWissenschaftler könnten hier viel von Webmastern lernen. Schließlich nutzen viele Wissenschaftler akademische Suchmaschinen wie Google Scholar für Ihre Literaturrecherche – manche gehen gar nicht mehr in die Bibliothek. Das heißt, Paper die nicht in Google Scholar, CiteSeer, etc. gelistet sind, existieren für manche (viele?) Wissenschaftler gar nicht. Dementsprechend sollten sich Wissenschaftler ebenfalls die Fragen stellen: Wird mein Paper eigentlich von Google Scholar gefunden? Und indiziert? Und wenn jemand bei Google Scholar nach dem Stichwort XYZ sucht, steht mein Paper dann ganz oben in der Ergebnisliste? Und wenn nicht, wie kann ich das ändern?

Zusammen mit zwei Kollegen habe ich im letzten Jahr Google Scholar untersucht, um herauszufinden, wie Google Scholar wissenschaftliche Artikel für eine Stichwortsuche rankt. Die Ergebnisse wurden diesen Monat in unserem Paper „Academic Search Engine Optimization (ASEO): Optimizing Scholarly Literature for Google Scholar and Co.“  im Journal of Scholarly Publishing veröffentlicht (vol. 41, no.2). Die wichtigsten Ergebnisse wollen wir hier vorstellen.

Bevor man überhaupt anfängt zu schreiben, muss man sich im Klaren darüber sein, für welche Stichworte inkl. möglicher Synonyme der Artikel optimiert werden soll. Es gibt viele Tools die einem helfen passende Stichworte zu finden, z.B. Google Trends, Google Insights, Google Adwords, Google Keyword Tool und Spacky.

Die wichtigsten Stichworte sollten dann möglichst oft im Artikel erwähnt werden und auch im Abstract und Titel.  Außerdem sollte mindestens jedes mögliche Synonym mindestens einmal im Artikel irgendwo erwähnt werden. Es liest sich vielleicht nicht ganz so gut wenn man beispielsweise einmal „Research Article“ und einmal „Scientific Article“ schreibt aber es erhöht die Wahrscheinlichkeit später bei Google Scholar gefunden zu werden.

Bei der Angabe von Namen, insbesondere seines eigenen, sollet man konsistent sein falls es verschiedene Möglichkeiten gibt den Namen zu schreiben. In meinem Fall sollte man also immer „Jöran“ schreiben und nicht ab und zu „Joeran“ (falls es gerade kein Ö auf der Tastatur gibt) oder „Joran“. Anderenfalls wird Google Scholar Schwierigkeiten haben die Namen zu identifizieren und Zitationen richtig zuzuordnen.

Der wichtigste Faktor für ein gutes Ranking bei Google Scholar sind Zitationen. Das heißt, wann immer es passt, sollte man seine eigenen Arbeiten zitieren. Google Scholar unterscheidet nämlich nicht zwischen Selbstzitationen und Zitationen von Dritten. Sprich, jede Referenz erhöht das Ranking (natürlich sollte man nicht jeden x-beliebigen Artikel von sich zitieren, das versteht sich von selbst). Es kann auch nicht schaden in der Referenzliste bei den eigenen Artikeln anzugeben wo diese heruntergeladen werden können. Unter Umständen nutzen akademische Suchmaschinen diese Links und auch wenn nicht, hilft dies zumindest den Lesern.

Ein Punkt, über den sich unserer Erfahrung nach die Wenigsten Gedanken machen sind Grafiken und Tabellen.  Oftmals enthalten Grafiken und Tabellen wichtige Schlüsselwörter aber werden als normale Grafik eingefügt (z.b. JPEG, GIF, PNG oder BMP). Das Problem ist, dass Google Scholar „normale“ Grafiken nicht indiziert. Es ist also sehr wichtig, dass Grafiken und Tabellen als normaler Text oder Vektorgrafik eingefügt werden. Nur so kann Google Scholar den Inhalt verstehen und den Artikel für entsprechende Suchen in der Ergebnisliste anzeigen.

Schließlich muss der Artikel von Google Scholar gefunden werden können. Wurde er bei einem bekannten Publisher (z.B. IEEE oder ACM) veröffentlicht, wird Google Scholar automatisch den Artikel vom Publisher erhalten.  Kooperiert der Publisher nicht direkt mit Google Scholar, ist die einfachste Möglichkeit, den Artikel später aus einem anderen Artikel heraus zu zitieren der bei Google Scholar indiziert ist. In jedem Fall sollte der Volltext des Artikels auch im Internet veröffentlicht werden, beispielsweise auf der eigenen Homepage oder der Institutswebseite. Nur so kann Google Scholar den Volltext indizieren und darauf verlinken.  Zwar verlinkt Google Scholar auch PDFs z.B. von ACM oder IEEE aber diese können in der Regel nur gegen Gebühr heruntergeladen werden. Wenn man also möchte, dass möglichst viele Leute einen Artikel lesen, sollte dieser als PDF frei verfügbar im Internet sein (natürlich muss man aufpassen, dass der eigentliche Publisher diese Praxis auch erlaubt). Es kann auch helfen den Artikel bei den verschiedensten sozialen Netzwerken hochzuladen. Zum Beispiel hat Google Scholar in Experimenten von uns Artikel indiziert die auf www.academia.edu hochgeladen waren obwohl diese Artikel Google Scholar vorher unbekannt waren.

Zu guter Letzt bietet Google Scholar eine sehr interessante Funktion. Wenn Google Scholar zwei PDFs von dem gleichen Artikel findet und diese PDFs sich leicht unterscheiden, indiziert Google Scholar beide PDFs so, als wären sie ein PDF. Das heißt, wenn man irgendwann feststellt, dass einige wichtige Stichworte in einem bereits veröffentlichten Artikel fehlen, dann könnte man eine modifizierte Version im Internet veröffentlichen und wenn Google Scholar dieses PDF indiziert hat würde der (alte) Artikel zu diesen Wörtern gefunden. In wieweit dies dem Wissenschaftskodex entspricht, wäre – unserer Meinung nach – höchste Zeit zu diskutieren.  Wir halten es für sinnvoll, sofern der modifizierte Artikel als solcher gekennzeichnet wird.

Mehr Informationen können in den folgenden Artikeln gefunden werden, die alle zum Download auf http://www.sciplore.org/publications_en.php angeboten werden.

Jöran Beel, Bela Gipp, and Erik Wilde. Academic Search Engine Optimization (ASEO): Optimizing Scholarly Literature for Google Scholar and Co. Journal of Scholarly Publishing, 41 (2): 176–190, January 2010.

Jöran Beel and Bela Gipp. Google Scholar’s Ranking Algorithm: The Impact of Citation Counts (An Empirical Study). In André Flory and Martine Collard, editors, Proceedings of the 3rd IEEE International Conference on Research Challenges in Information Science (RCIS’09), pages 439–446,

Jöran Beel and Bela Gipp. Google Scholar’s Ranking Algorithm: An Introductory Overview. In Birger Larsen and Jacqueline Leta, editors, Proceedings of the 12th International Conference on Scientometrics and Informetrics (ISSI’09), volume 1, pages 230–241, Rio de Janeiro (Brazil), July 2009.

Jöran Beel and Bela Gipp. Google Scholar’s Ranking Algorithm: The Impact of Articles’ Age (An Empirical Study). In Shahram Latifi, editor, Proceedings of the 6th International Conference on Information Technology: New Generations (ITNG’09), pages 160–164, Las Vegas (USA), April 2009.

Uni News: Revolution und Erfolge

November 17th, 2009

- An einigen Universitäten wird wieder Revolution geprobt. Was es selbst bis in die Tagesschau geschafft hat, wird in den Pressemitteilungen der Universitäten erstaunlicher Weise kaum erwähnt. Dort wo es erwähnt wird lautet der Tenor meist “Reden ja, Hörsäle besetzen nein. Modifikationen beraten ja, grundelgende Änderungen nein.” Revolution

Eine interessante Anekdote aus Würzburg: die Protestler wollten ursprünglich einen Mathematik-Hörsal besetzen, wurden aber von den Mathe-Studenten wieder vertrieben: die wollten lieber ihre Vorlesung hören, als protestieren. Daraufhin wurde eben das AudiMax der wirtschaftswissenschaftlichen Fakultät besetzt. Dort war der Widerstand weniger Entschieden, so dass die 200 Lernwilligen sich den 50 Demonstranten geschlagen gaben und die Hörsaalbesetzung erfolgreich verlief.

- Die FU Berlin und die TU München freuen sich über schöne Erfolge:

In der TUM konnte die neugegründete erste deutsche Fakultät für Lehrerbildung und Bildungsforschung einen Traumstart hinlegen. Es konnte die Rekordsumme von 16 Millionen Euro Stiftungsmitteln eingeworben werden. Diese hohe Spendenbereitschaft zeigt auch die Bedeutung, die dem Thema Lehrerbildung zugemessen wird. Zur Presseerklärung.

Die FUB bejubelt das gute Abschneiden ihrer Politikwissenschaftler bei einem internationalen Ranking: “Politikwissenschaftler der Freien Universität gehören europaweit zu den besten – CHE-Ranking stuft das Fach in die Exzellenz-Gruppe ein”, heißt es in der Pressemitteilung.

- Zum Abschluss noch zwei Forschungsprojekte zum Thema Sprache:
Forscher untersuchen Baby-Geschrei und finden heraus: Schon wenige Tage alte Babys schreien in ihrer Muttersprache.
Jugendliche untersuchen ihre eigene Sprache: in einem Internetportal wird Jugendsprache erforscht.

Für die Bundesregierung ist klar: Das Urheberrecht muss auch im Internet seinen Platz finden. Deshalb lehnen wir es ab, dass ohne jeden urheberrechtlichen Schutz die Bücher einfach eingescannt werden, wie dies von Google gemacht wird.” sagt Angela Merkel.

Google DatenkrakeFinde ich gut, dass endlich mal jemand Google in die Schranken weisen möchte. Wobei man wissen muss, dass nicht nur Google einen haarsträubenden Umgang mit Datenschutz und Urheberrecht hat. Das gilt für die meisten Mainstream-Anbieter im Internet. Wussten Sie schon: wenn Sie Daten bei Google speichern, darf Google sie durchsuchen und verwerten. Wenn Sie Bilder bei Flicker hochladen, gehören sie Flicker, usw. Ich finde das grauslich. Ich wiederhole mich, aber es bleibt aktuell: der Gedanke, dass Google meine Doktorarbeit durchsucht, bevor ich sie veröffentlicht habe, ist mir zuwider.

Bei scholarz.net fahren wir eine entgegengesetzte: absoluter Schutz der Privatsphäre. Ihre Daten gehören Ihnen und nur Ihnen und nur das wird von irgendwem durchsucht, das Sie ausdrücklich dafür freigeben. Der Rest ist privat. Und mit privat meinen wir privat. Wir sind zwar nur eine kleine Nische, aber dafür eine Forscher-freundliche Nische.

Wieder mal das Thema Datenschutz im Internet. Eben lese ich: Soziale Netzwerke mit mangelndem Fair-Play: Verbraucherzentrale Bundesverband geht gegen Geschäftsbedingungen von Sozialen Netzwerken vor. Es ist verheerend, wie die meisten Web-Unternehmen mit den Daten Ihrer Kunden umgehen. Wussten Sie, dass Google alle Daten durchsuchen darf, die Sie z.B: bei Google Docs einstellen? Mir dreht sich der Magen um, bei dem Gedanken, dass Google meine Doktorarbeit durchsucht, bevor ich sie publiziert habe. Oder: bei den meisten (besonders amerikanischen) Web-Unternehmen gehören alle Daten, die Sie einstellen, dem Anbieter. Wenn ich eine wissenschaftliche Arbeit schreibe, dann möchte ich, dass sie mir gehört, nicht dem Anbieter der Software, die ich nutze.

z-schlossPrivate Daten sind immer wichtig. Für Wissenschaftler sind sie das Allerheiligste. Desshalb haben wir bei scholarz.net eine extrem strikte Datenschutzpolitik. Wir bieten Ihnen Handwerkszeug und wir bieten Ihnen Speicherplatz. Was Sie damit machen ist Ihre Sache und geht uns nichts an. Alle Daten die Sie einstellen, gehören Ihnen und ausschließlich Ihnen. Niemand kann sie sehen, außer Sie selbst machen die Daten öffentlich. Wir durchsuchen Ihre Daten nicht, wir werten Ihre Daten nicht aus, und wir geben Ihre Daten nicht weiter. Weder die Forschungsdaten, noch die Profildaten, noch sonst etwas. Wir haben unsere eigenen Doktorarbeiten in scholarz.net. Wir wissen, wie wichtig das Thema ist und wir verhalten uns entsprechend.

Die letzten Tage ging es um den Datenimport aus PubMed und Literaturverwaltungsprogrammen. Aber was, wenn man auf anderen Internetseiten oder online Katalogen recherchiert und seine Ergebnisse direkt in scholarz.net importieren möchte?

Wir arbeiten zwar an einigen spannenden Funktionen, die bibliographische Daten direkt aus den Seiten auslesen und neue Quellen daraus erstellen, aber die Fertigstellung wird noch etwas dauern. Bis dahin kann man sich aber mit einem kleinen Umweg behelfen:

Read more »

Gestern und vorgestern war ich in Hagen auf der Expertenanhörung der Hochschulrektoren-Konferenz zum Thema Wissenschaft und Web 2.0. Zwei sehr interessante Tage mit guten Gesprächen, interessanten Kontakten und spannenden Vorträgen. Einerseits habe ich mich über die Möglichkeit gefreut, scholarz.net vorzustellen und für unsere Vision zu werben, das Web 2.0 für die Forschung fruchtbar zu machen. Andererseits habe ich auch viele Anregungen für uns selber mitgenommen und viel von den anderen Experten gelernt.

Da es von anderen Teilnehmern schon gute Berichte gibt, spare ich mir eine erneute Beschreibung des Programms und verweise einfach auf die Kollegen.

Sowohl der Post von Jan Schmidt im Schmidtmitdete-Blog als auch der Bericht von Thomas auf E-Learning 2.0 sind sehr lesenswert.

Import-Formatescholarz.net unterstützt den Import von biblio-graphischen Daten in einigen verschiedenen Formaten, darunter die wichtigsten Literaturvewaltungs-Formate Endnote und BibTeX. Gestern ging es um den Import von bibliographischen Daten von PubMed zu scholarz.net. Heute zeigen wir am Beispiel Endnote, wie man seine Bibliothek aus einem Literaturverwaltungsprogramm zu scholarz.net übertragen kann.

Endnote Style

Read more »

Hätten Sie gedacht, dass Juristen und Künstler das Web 2.0 am wenigsten von allen Forschergruppen verwenden? Besonders bei den Juristen musste ich mir die Augen reiben – selbst Theologen, Philosophen und Sportler fühlen sich im Internet wohler. Ganz vorne liegen – wenig überraschend – die Medien- und Informatik-Fächer.

Web20-Nutzung

Und was denken Sie?

Welche Erkenntnisse Sie besonders interessant, spannend oder überraschend? Wo könnte man weiterforschen? Welche Fragen haben sich für Sie eröffnet oder geklärt? Wir freuen uns über Kommentare!

(Gestern Teil 3: Wer braucht schon Netzwerke?)
(Die vollständige Studie „Wissenschaftlich Arbeiten im Web 2.0“ finden Sie hier.)

Warum bloggen wir überhaupt?

52% der befragten Wissenschaftler lesen niemals Blogs, während gerade einmal jeder hunderste mehr als dreimal die Woche auf einem Blog zu Gast ist. Sind wir nur ein kleiner Haufen Esoteriker, der in seiner eigenen Brühe kocht?

Immerhin: zumindest 92% kennen den Begriff “Blog”. Und fast jeder zehnte Wissenschaftler ist aktiver Blogger, wenngleich die Mehrheit lieber über private Themen schreibt. Dabei sieht man doch an “Wissenswerkstatt” oder “Tiefes Leben”, dass eine Verknüpfung zwischen Wissenschaft und Blogs neue und spannende Möglichkeiten bietet: So werden unterschiedlichste Themengebiete abgedeckt, neue Perspektiven erschlossen und anregende Diskussionen gestartet.

Möglicherweise ist Bloggen aber doch eine zu aufwändige Tätigkeit, vor allem wenn sie wissenschaftlichen Ansprüchen an Exaktheit und Seriosität gerecht werden will. So liegt es vielleicht am schieren Zeitmangel im Wissenschaftsbetrieb, dass Blogs sich noch nicht auf ganzer Linie als Mittel der Wissenschaft durchgesetzt haben.

Blognutzung


Wer braucht schon Netzwerke?

Noch immer wissen 8% der Wissenschaftler nicht, was man unter Social Networking zu verstehen hat – und weitere 40% sind schlichtweg nicht überzeugt.

Diese Zahl überrascht uns dann doch. Wir sind davon ausgegangen, dass mindestens 85% der Wissenschaftler bei StudiVZ, XING &Co. angemeldet sind, da ja angeblich „jeder“ diese Paradebeispiele des Web 2.0 verwendet. Laut unserer Umfrage nutzen jedoch nur 23% diese Plattformen häufig bis sehr häufig, 35% selten bis eher selten.

Es ist nicht viel mehr als ein Gerücht, dass die Welt des Social Networking auch in der Wissenschaft angekommen sei – schade eigentlich, schließlich ist gerade das „Kontakte knüpfen“ schon am Beginn der akademischen Laufbahn sinnvoll. (Wer jetzt damit anfangen will, kann das ja gleich in scholarz.net tun ;-) ).

(Gestert Teil 2: Alltagshilfe und Todsünde Wikipedia)
(Die vollständige Studie „Wissenschaftlich Arbeiten im Web 2.0“ finden Sie hier.)

Alltagshilfe und Todsünde Wikipedia

99% der von uns befragten Wissenschaftler kennen Wikipedia – über so einen hohen Bekanntheitsgrad kann sich im deutschsprachigen Raum wahrscheinlich nur noch der Papst freuen. Auch in der täglichen wissenschaftlichen Arbeit ist Wikipedia kaum mehr wegzudenken: 64% nutzen die Online Enzyklopädie häufig (mehr als einmal in der Woche), gerade einmal 5% nutzen sie nie.

Vermutlich gilt aber auch: kaum jemand wird vor seinem Professor zugeben, sich regelmäßig bei Wikipedia in Themengebiete einzulesen oder sie gar als Anlaufstelle für alle Gelegenheiten zu nutzen. Was aber der Fall ist: So erreicht die Aussage „Ich nutze Wikipedia zur schnellen Einführung in ein Themengebiet“ auf einer fünf-stufigen Likert-Skala (1 = trifft nicht zu, 5 = trifft voll zu) einen Mittelwert von 4,19. Der Aussage „Seiten wie Wikipedia sind eine echte Erleichterung für mich“ stimmen die Teilnehmer immerhin mit einem Wert von 3,49 zu.

Zugleich aber geben die Teilnehmer mit gleicher Vehemenz (Mittelwert 3,54) der – natürlich leicht ironisch gemeinten – Aussage Recht: „Aus Wikipedia zu zitieren ist eine Todsünde“. So kann man wohl von einem etwas zwiespältigen Erfolg von Wikipedia in der wissenschaftlichen Welt sprechen: jeder kennt sie, alle nutzen sie, aber darüber sprechen darf man höchstens beim Mittagessen mit Kollegen…

Jeder kennt Endnote

Von 2361 Teilnehmern, die unsere Fragebögen vollständig ausgefüllt hatten, kannten nur 12% diese Form des Reference Management nicht. Weitere 28% nutzen die Desktop Programme nicht, selbst wenn sie sie kennen. Ursache könnte beispielsweise die Furcht vor einem gewissen Einarbeitungsaufwand sein oder die Vermutung, daraus keinen erheblichen Nutzen zu ziehen. Dennoch sind sechs von zehn Doktoranden von den Vorzügen der desktopbasierten Literaturverwaltung überzeugt.

(Teil 1 gestern )
(Die vollständige Studie „Wissenschaftliches Arbeiten im Web 2.0“ finden Sie hier.)

Copyright © scholarz.net blog. All rights reserved.
Impressum