Lesezeichen und Kommentare aus PDFs auslesen

Endnote, jurabib, Latex u.v.a.: Die Softwarefragen von Doktoranden sind vielseitig, Hier findest Du Antworten auf eine ganze Reihe davon.
Für Fragen zu MS Word gibt es den eigenen Bereich.

0
Keine Stimmen
 
Insgesamt abgegebene Stimmen: 0

Mr_Endorphine

Lesezeichen und Kommentare aus PDFs auslesen

Beitrag von Mr_Endorphine »

Hallo Leidensgenossen,
ich bin vor kurzer Zeit auf ein recht interessantes Tool zum Verwalten der Dissertationsinhalte gestossen.
Die Software, sie heißt SciPlore MindMapping bietet eine ganz interessante Funktion.

Das Auslesen von Lesezeichen und Kommentaren aus PDFs.
Wie manche vielleicht schon wissen. Der neue Acrobat Reader (X) und andere Programme (z.B. PDF X-Change Viewer) bieten jetzt schon standardmäßig die Funktion Kommentare, Hervorhebungen, u.o. Lesezeichen einzufügen.

Mit dieser Funktion ist es also nicht mehr nötig Paper auszudrucken. Das gesamte Editieren kann am Computer stattfinden.
Vorteil gegenüber z.B. Citavi: Ich habe die Kommentare, Lesezeichen, Links usw... direkt in meinem PDF abgespeichert, und sehe direkt, auf welches Wort sich der Gedanke bezieht, (In Citavi kann ich Gedanken nur einzelnen Seiten zuordnen. Keine Markierung im Programm möglich.)

So da ich Hervorheben, Kommentieren, usw... in PDF-Programmen besser als in Citavi durchführen kann, würde ich es gerne dort machen. Aber jetzt mein Problem: Wie kann ich aus Citavi auf die Kommentare und Lesezeichen des PDF zugreifen, oder z.B. als Gedanken importieren? Weiß das einer? Weil am Ende möche ich alles in Citavi haben.
(und zwar automatisiert :D )

Das Anfangs erwähnte Programm hat dazu eine ganz nette Funktionalität. Leider hat es allerdings andere Nachteile (keine Literaturverwaltung.)

Anzeige:

bbb

Re: Lesezeichen und Kommentare aus PDFs auslesen

Beitrag von bbb »

Hallo,

zu Citavi kann ich nichts sagen, denn ich habe zwar mal als Beta-Tester damit gearbeitet, mich danach aber doch auf JabRef verlassen, auch weil der BibTeX-Export immer wieder holprig war.
Ich antworte ein bißchen "an Deiner Frage vorbei" in der Hoffnung, dass es zur Diskussion beiträgt.

DIe Möglichkeiten von SciPlore MindMapping (heißt jetzt Docear) sind ziemlich gut und die Literaturverwaltung bekommst Du ja, wenn Du SciPlore auf eine BibTeX-Datenbank zugreifen lässt, oder nicht?

Ich habe schon seit längerer Zeit den PDF-Viewer Skim verwendet (gibt es nur für MacOS X), der wirklich gute Funktionen zum Kommentieren von PDFs hat und habe diese auch fleißig genutzt.
Allerdings habe ich es damals mit SciPlore nicht geschafft, diese Skim-Kommentare auszulesen und habe letztlich ein anderes System verwendet, um die Kommentare zu verwalten:
MindMapping habe ich fürs Sortieren der Gedanken und Schreiben dann auch verwendet.
Ich arbeite mit FreePlane (hat sich aus FreeMind entwickelt), das die Code-Basis für die kommende Version von SciPlore darstellen wird.

Super ist, dass man z. B. LaTeX-Formeln direkt im MindMap schreiben kann und dass die Entwickler sehr freundlich, kurzfristig und hellhörig auf Ergänzungs- oder Änderungswünsche reagieren.

Das Problem mit dem Papiersparen ist allerdings, dass bei den meisten Leuten die Bildschirmfläche sehr begrenzt ist (ein früherer Doktoranden-Kollege sagte mal so schön "der Trend geht zum Dritt-Monitor" :D ), während man Ausdrucke schön um sich herum auf dem Schreibtisch, sonstigen Ablagen und Fußboden verteilen kann. ;-)
Beide Ansätze haben Vor- und Nachteile und in gewissen Situationen sicherlich seine Berechtigung.
Allein schon die Möglichkeit der Volltextsuche in PDFs ist aber von unschätzbarem Wert.
Mr_Endorphine

Re: Lesezeichen und Kommentare aus PDFs auslesen

Beitrag von Mr_Endorphine »

Hallo bbb, vielen Dank für den hilfreichen Kommentar. Ich werde mir die genannten Tools mal anschauen.

Noch eine Frage zu Citavi. Wenn ich von der anderen Seite her komme.
Kennt jemand vielleicht ein Plug-in, das es auch in Citavi ermöglicht Texthervorhebungen und Kommentare in das PDF direkt einzubauen?

Viele Grüße, endorphine
bbb

Re: Lesezeichen und Kommentare aus PDFs auslesen

Beitrag von bbb »

welche der genannten Tools meinst Du?

Da Du Citavi nutzt, arbeitest Du vermutlich unter Windows?
Insofern kommt Skim nicht in Frage.

Mit welchem Programm willst Du denn die Doktorarbeit schreiben?
Sollte es LaTeX sein, dann würde es sich ja geradezu aufdrängen, die Literatur mit BibTeX zu verwalten.
Ein sehr gutes (und kostenloses) Tool dafür ist JabRef http://jabref.sourceforge.net/.

FreePlane (http://freeplane.sourceforge.net/) ist super, aber wenn es bei Dir auf ein paar Wochen oder Monate nicht ankommt, dann kannst Du ja "Docear" die neue Version von SciPlore MindMapping verwenden, die meines Wissens auf Freeplane basieren wird.

Bezüglich der Notizen in PDF Dateien habe ich sehr viel positives über Sumatra PDF (http://blog.kowalczyk.info/software/sum ... eader.html) gehört, habe aber selbst noch nicht damit gearbeitet.

Meine Erfahrung mit den elektronischen Notizen ist:
man braucht ein gutes System, um diese hinterher zu sortieren und zu ordnen.
Ich hatte meine Schwierigkeiten mit den Mindmaps, weil sie sehr schnell ziemlich "träge" werden und es mir schwer fiel, die Übersicht zu behalten.
Es wäre aber vermutlich auch nötig gewesen, sich mehr in die Möglichkeiten der Software einzuarbeiten (Knotenstile, etc.) und diese konsequent zu nutzen.
Da ich mich in der Hauptsache auf meine DevonThink-Datenbank verlassen habe, war (für mich) eine Integration der MindMaps schwierig.

Die Anregungen im hier (viewtopic.php?f=25&p=70128#p70128) genannten Blog zum "vollelektronischen Workflow" und zur Verwaltung von Notizen und Exzerpten in einem Wiki sind sehr gut.
Für mich kamen sie einfach zu spät - der Aufwand, mein gewachsenes (und sehr unvollkommenes) "System" dorthin "umzustricken", wäre zu groß gewesen, aber wenn man noch am Anfang ist oder mehr Zeit hat, finde ich die Ideen und Ansätze sehr interessant.

Gruß

Martin
wai

Re: Lesezeichen und Kommentare aus PDFs auslesen

Beitrag von wai »

Hi,
bbb hat geschrieben: Das Problem mit dem Papiersparen ist allerdings, dass bei den meisten Leuten die Bildschirmfläche sehr begrenzt ist (ein früherer Doktoranden-Kollege sagte mal so schön "der Trend geht zum Dritt-Monitor" :D ), während man Ausdrucke schön um sich herum auf dem Schreibtisch, sonstigen Ablagen und Fußboden verteilen kann. ;-)
Ein anderes Problem ist, dass meist wenig weiße Fläche am Rand der pdf-Dateien ist, in die man seine Kommentare schreiben kann. (Oder schreibt ihr die in solche Gedankenblasen, die man erst aufklicken muss, bevor man sie sieht?) Da fände ich es nützlich, wenn es eine Funktion gäbe, mit der man den eigentlichen pdf-Text z.B. um auf 70% oder 50% (je nach Lesbarkeit) verkleinern und in die Mitte der Seite zentrieren kann, so dass am Rand mehr Platz zum kommentieren bleibt. Ich habe nach sowas gegoogelt, aber nichts gefunden. Weiß jemand, ob es ein Programm mit einer entsprechenden Funktion gibt?

Für Notizen/Kommentare in PDF-Dateien verwende ich PDF-XChange-Viewer. Das ist ein kostenloses Programm und ich komme bisher (bis auf die vermisste Funktion) gut zurecht, habe aber auch nicht mehr gemacht/versucht außer eben Notizen in pdfs zu schreiben. Wie man die Notizen aber importieren kann, weiß ich leider nicht.
bbb

Re: Lesezeichen und Kommentare aus PDFs auslesen

Beitrag von bbb »

@wai:
Ja, der Platz für Notizen in PDFs ist manchmal sehr begrenzt.
Bei Skim gibt es neben der PDF-Ansicht auch ein Notizen-Fenster, in dem man die Notizen sehen kann und zum Beispiel auch Anmerkungen zu hervorgehobenem Text machen kann.

Bildschirmfoto: http://skim-app.sourceforge.net/images/mainWindow.png

Außerdem gibt es viele verschiedene Typen von Notizen.
Trotzdem fand ich es aber schwierig, mit diesen zu arbeiten und habe letztlich alle relevanten "Textblöcke", die ich in meiner Arbeit verwenden will, als einzelne Informationen (mit Schlagworten, Quellenangabe und Link zur Original-PDF-Datei) in meine Datenbank gespeichert.


Zum Thema mehr Rand für PDFs:
Es gibt das kostenlose Programm BRISS, das eigentlich das Gegenteil macht (PDFs beschneiden, so dass weiße Ränder entfernt werden).
https://sourceforge.net/projects/briss/

Frag' doch einfach mal die Autoren, ob es auch umgekehrt gehen könnte, dass man die sichtbare PDF-Seite vergrößert.
Ansonsten könnte es eventuell möglich sein, das PDF in ein neues PDF zu drucken, und dabei einen Zoomfaktor zu verwenden (Verkleinerung) oder das Seitenformat zu ändern.
Aber es könnte natürlich sein, dass dadurch Informationen im PDF (wie z. B. Hyperlinks oä) "leiden"..
Manyra

Re: Lesezeichen und Kommentare aus PDFs auslesen

Beitrag von Manyra »

Suche auch schon länger nach einer guten, einfachen und praktikableren Methode, wie ich meine Paper digital lesen, bearbeiten und Informationen sammeln kann.
Momentan finde ich es schon schade, dass es sehr viele akademische Programme nur für Mac gibt, und diese PCs doch recht teuer sind.

Hab schon viel getestet und momentan arbeite ich mit dem PDF-X-Change viewer. Den habe ich mir in Windows und im Firefox Browser als Programm für PDFs eingestellt, so das jedes PDF direkt mit ihm geöffnet wird.
Meine Papaer sammle ich in Zotero vorab, und die die ich wirklich lese improtiere ich in Citavi 3.
In Citavi 3 gibt es die Vorschau, die super ist. Auch von dort läst sich per Click das PDF auswählen und im PDF-X-Change viewer öffnen. Ich lese es dort, male darin herum und füge Kommentare ein.
Wichtige Textstellen werden mit gelbem Marker hinterlegt und zusätzlich per copy&paste in ein Citavi-Zitat überführt.
Ist zwar doppelte Arbeit, aber am Ende sehe ich die Markierung in der Citavivorschau und hab das Zitat in der Liste

Parallel teste ich noch Onenote von Microsoft, das ist bei Office Home & Student dabei und wird von den wenigsten benutzt. Dort gibt es die Möglichkeit PDFs in das Notizbuch direkt einzufügen, dann lassen sich auch Kommentare schreiben und der Text wird in die Volltextsuche integriert. Wird nur ein sehr sehr großes Notizbuch, wenn man alle gelesenen Paper einfügt.
Bei Onenote gibt es keine vordefinierte Seitengröße (außer man stellt es manuell auf DIN A4 oder so), daher lassen sich dort beliebig viele Kommentare daneben oder darunter schreiben.
PDFs (und andere) Dateien lassen sich aber auch nicht komplett einbinden sondern verlinken. Neben den Link können dann die dazugehörigen Kommentare geschrieben werden.
Für mich hat Onenote ein riesen Potential für die Informationssammlung und -verwaltung.

Die hier erwähnten Programme werde ich mir wohl auch anschauen, man weiß ja nie. Danke für die Hinweise.
bbb

Re: Lesezeichen und Kommentare aus PDFs auslesen

Beitrag von bbb »

@Manyra:

In der Tat gibt es viele tolle Freeware für MacOS X, aber für Windows ist das Software-Angebot doch ungleich größer...
sollte da wirklich nichts dabei sein?

zu OneNote:
Wird nur ein sehr sehr großes Notizbuch, wenn man alle gelesenen Paper einfügt.
Ich gebe zu, ich habe mit dem Programm nie gearbeitet. Ich wollte es mal testen, aber da ich alle wichtigen Dinge zum Schreiben auf meinem privaten MacBook verfügbar haben wollte (was rückblickend eine sehr gute Entscheidung war), kam es letztlich nicht in Frage.

Der Hinweis mit dem "sehr großen Notizbuch" gibt mir zu denken, denn die Frage ist:
Was, wenn das Ding irgendwann mal streikt und Dir um die Ohren fliegt?
Regelmäßige Backups sind bei sowas sehr wichtig - es mag zwar ein Vorurteil aus alten Zeiten sein, dass Microsoft-Produkte nicht immer stabil sind und manchmal einfach Daten "zerschießen", aber ich wäre da sehr vorsichtig, meine Daten in ein System zu füttern, das sie in einem (nehme ich zumindest an) proprietären Datenformat verwurstet, so dass ich sonst keinen Zugang dazu habe.

In DevonThink, das ich als Datenbank verwende, sind zumindest die eingegebenen Notizen als einzelne Textdateien (TXT od. RTF) verfügbar und die PDFs sind auch als solche im Datenbank-Package zugänglich und die Schlagworte (Tags) werden mit dem jeweiligen Dokument gespeichert.
Sollte das Programm also irgendwann mal streiken oder die Datenbank "defekt" sein, könnte ich zumindest einen Teil der Informationen bzw. "Rohdaten" von Hand retten, auch wenn natürlich viele Meta-Informationen verloren wären.
Manyra

Re: Lesezeichen und Kommentare aus PDFs auslesen

Beitrag von Manyra »

Gerade eine Windowsalternative zu DevonThink habe ich noch nicht gefunden. Es gibt zwar ähnliches, aber nicht exakt so für akademische Zwecke geeignetes.
Ich würde mir am liebsten aus Citavi3, Mendeley, PDF-X-change viewer ein perfektes Programm zusammenbasteln.

Onenote bietet zum Glück das Verlinken von PDFs an, so das nicht das ganze Paper im Notizbuch landet. Es landet dann aber auch nicht in der Volltextsuche, aber die reicht ja auch für die Kommentare aus. Die PDFs landen (so wie ich das überblicke) in einem speziellen Ordner. Die Originalverlinkte Datei kann gelöscht werden und der Onenotelink öffnet weiterhin die Datei.
Onenote kann automatisch Backups erstellen, davon mache ich regen gebrauch.
Alle PDFs sind separat in einem Ordner untergebracht. Das ganze Notizbuch aus Onenote lässt sich als PDF abspeichern, wodurch man auch diese Daten mit der Zeit nochmal extra sichern kann.

Ein Programmabsturz kommt leider nicht nur bei MS-Programmen vor. Auch Citavi hat mir mal ganz schön Arbeit gemacht.
Seither bin ich ziemlich besessen, was Backups angeht.
bbb

Re: Lesezeichen und Kommentare aus PDFs auslesen

Beitrag von bbb »

ja, DevonThink scheint tatsächlich relativ "alternativlos" zu sein.
Wobei die Frage ist, welche Features Du wirklich brauchen würdest.

Hast Du Dir mal Inforapid Knowledgemap (http://www.inforapid.de/html/knowledgemap.htm) angeschaut?
Ansonsten könnte eventuell ein Wiki helfen oder ein Wechsel zum Mac.

Zur Volltextsuche in PDFs könnte vielleicht ein Tool wie Copernic Desktop search oä hilfreich sein?
Allerdings gebe ich zu, dass die Möglichkeit, Operatoren wie AND, OR oder NEAR zu verwenden, bei den Suchen in DevonThink sehr hilfreich ist.

Gruß

Martin
Gesperrt