eXma » Diskutieren » Computer und Technik
Startseite - Veranstaltungen - Mitglieder - Suche
Vollständige Version anzeigen: Latex2ODF
skype66
HAllo liebe Gemeinde,

ich würde gerne wissen, was ihr von folgendem hält:
Latex in ODF transformieren udn umgekehrt. (ODF immer mehr als Austauschformat eingesetzt, also dann auch komplexe .tex-Dokumente in .odt umwandeln und abschicken)

???
Ich danke im Voraus und verbleibe mit freundlichen Grüßen
mcnesium
ich halte davon nix. das is ja nich viel besser als .doc dateien durch die gegend zu schicken. odf sollte auch nicht als "austauschformat" eingesetzt werden, denn das ist es nicht. odf wird von openoffice als standard-dateiformat zum erstellen und bearbeiten von dokumenten genutzt. latex-dateien analog. wenn man ein dokument veröffentlichen oder verschicken will, nimmt man dafür ein dateiformat, dass dafür gedacht ist, nämlich das PDF, portable document format. das hat viele eigenschaften, die speziell fürs portabel sein konzipiert sind, wie getrennter dateisystemunabhängiger lese- und schreibschutz, digitale signaturen, eingebundene medien wie foto, audio, video und weblinks. und sie sind (wenn man es richtig macht) auch kompakter in der dateigröße als die .odfs, .docs, .psds etc...
Keinstein
Zitat(mcnesium @ 21 Jun 2007, 11:41)
odf sollte auch nicht als "austauschformat" eingesetzt werden, denn das ist es nicht. *


Klar ist ODF ein Austauschformat: es wird von so ziemlich jedem modernen Textverarbeitungsprogramm gelesen und geschrieben und vor allem: Es ist ISO-Standard. Damit ist es als Austauschformat ebenso geeignet, wie LaTeX, DVI, PostScript oder PDF. Welches von den Formaten man jetzt verwenden sollte hängt vom Zweck und der Form des Austausches.

Soll der Empfänger das Dokument nicht verändern, ist PDF oder PostScript zu empfehlen. Hat er dazu noch eine Dünne Leitung und ein aktuelles Tex installiert, dann DVI. Soll er jedoch aktiv am Dokument mitarbeiten, dann solltet Ihr Euch vor Beginn der Arbeiten auf ein Format einigen. Will er nur Teile rauskopieren und in eine Textverarbeitung á la Word integrieren, dann ODF. ODF wird nämlich von den meisten aktuellen Textverarbeitungssystemen gelesen und geschrieben. Nicht nur OpenOffice verwendet es als Standard-Format. Und MS Word wird es bald auch in vertretbarer Qualität können.
skype66
Ich danke euch für die lehrreiche Antwort.

Es geht mir im Grunde nur um die Grammatik, die Syntax, wie
der genaue Verlauf bei der Transformation aussieht.
Ich will ein geeignetes Format zur Transofrmation in das ODF, nur um den internen Verlauf bzw. die Grammatik, das Konzeot, die dahinter steckt näher zu betrachten.
Analyse der Grammatik vom Quell-Format und die des Zielformats (in diesem Zusammenhang das ODF) anhand eines Beispiels

Bei der Handhabung des Beispiels sollte vielleicht nicht irgendein Format zur TRansformation betrachtet werden, sondern etwas was in etwa SInn macht wink.gif
Welches FOrmat wäre geeignet?
Welches Format würdet ihr bevorzugen?
.pdf, .fm, .doc, .tex, .htm, etc
die ersten drei sind proprietäre Formate, die ich aus diesem Grunde nicht bevorzugen würde
was meint ihr mit html oder habt ihr einen besseren Vorschlag??

MIt bestem Dank im Voraus

Keinstein
Zitat(skype66 @ 06 Jul 2007, 15:44)
Es geht mir im Grunde nur um die Grammatik, die Syntax, wie
der genaue Verlauf bei der Transformation aussieht.
Ich will ein geeignetes Format zur Transofrmation in das ODF, nur um den internen Verlauf bzw. die Grammatik, das Konzeot, die dahinter steckt näher zu betrachten.
Analyse der Grammatik vom Quell-Format und die des Zielformats (in diesem Zusammenhang das ODF) anhand eines Beispiels*

Ich interpretiere das so: Du willst einen Konverter von XXX nach ODF bauen (zumindest theoretisch durchdenken)?

Zitat(skype66 @ 06 Jul 2007, 15:44)
Welches FOrmat wäre geeignet?
Welches Format würdet ihr bevorzugen?
.pdf, .fm, .doc, .tex, .htm, etc
die ersten drei sind proprietäre Formate, die ich aus diesem Grunde nicht bevorzugen würde
was meint ihr mit html oder habt ihr einen besseren Vorschlag??*


.fm sagt mir nix.
An .doc haben sich schon viele die Zähne ausgebissen.
HTML fände ich ziemlich unspannend, da OpenOffice das ja sowieso schon ganz gut macht.
Bleiben noch TeX und PDF. Beide haben ihre Schwierigkeiten:

TeX ist eine Programmiersprache, erfordert also einen Interpreter. Nur wenige Dokumente, die von vornherein darauf zugeschnitten sind, anderweitig konvertiert zu werden, halten sich an die strengen Dateiformate von z.B. LaTeX und TeXinfo. Das hat zu unterschiedlichsten Ansätzen für die Konvertierung von Dateien von LaTeX nach HTML geführt. Der meiner Meinung nach vielversprechendste Ansatz ist tex4ht, das auch sxw-Dateien erzeugen kann. ODT ist geplant (wenn's nicht schon fertig ist). Ist kompliziert zu benutzen, funktioniert dafür aber umso besser.

PDF ist in einigen Dialekten anerkannter Standard und eine relativ neue Version wurde komplett als Standard eingereicht. Außerdem ist es IMHO öffentlich dokumentiert. Ich fände es spannend PDF->odt und PDF->SVG usw konvertieren zu können. Aber ich befürchte, dass man dafür gute Schätz-Algorithmen braucht, um das Bild in ein brauchbares Textformat umzuwandeln. PDF scheint mir -- verkürzt ausgedrückt -- eine Art druckerfreundliche Vektorgrafik mit Hypertext-Eingenschaften und Unmengen an Erweiterungen zu sein, also ein Dokument, das fast nur aus Form besteht. ODF kennt da mit Stilen usw. wesentlich mehr Inhalt. Das genaue Maß von beiden Formaten kenne ich jedoch nicht.
Chris
TeX ist ja wohl eher eine Markupsprache, wie sie auch HTML ist. Auch wenn es die Möglichkeit gibt, Markups anzulegen. Als Programmiersprache würde ich das aber lediglich, weil es interpretiert wird, nicht bezeichnen. Genausowenig wie HTML eine Programmiersprache ist. Aber das nur am Rande.

PDF indes ist eine vektorbasierte Auszeichnungssprache. Ähnelt wohl dem bekannten Ghostscript, dürfte aber umfangreicher sein.

Ein Standard ist immer offengelegt. D.h. auch das neue PDF Format ist komplett offengelegt.

Allerdings würde ich PDF als wesentlich komplexer einschätzen als TeX.

Aber da kommt es ja darauf an, wieviel du konvertieren möchtest. Wenn du lediglich Text mit Formatierungen übertragen möchtest, dürften sich die einzelnen Formate nicht allzuviel nehmen. Es wäre nur auf folgende Sachen hinzuweisen:
PDF ist ein Format, dass überall gleich aussieht.
TeX und HTML/XHTML sind Formate, die erst zur Interpretationszeit ihr Aussehen erhalten. Wie die beiden dann aussehen, hängt von den Stylesheets ab.
Bei TeX hat man normalerweise einen Satz Stylesheets vorgegeben, der überall eigentlich auch gleich oder sehr ähnlich aussieht. Zudem gibt es meines Wissens nach keine Unterschiede beim Interpreter.
Anders bei HTML/XHTML, dort ist der Interpreter der Browser und es kann sich doch schon von Browser zu Browser unterscheiden, wie die Stylesheets genau gerendert werden.

Generell würde ich vorschlagen, ein gut dokumentiertes Format zu nehmen, da macht man sich nicht den absoluten Stress herauszufinden, welcher Befehl zu was taugt.
Keinstein
Zitat(Chris @ 06 Jul 2007, 17:59)
TeX ist ja wohl eher eine Markupsprache, wie sie auch HTML ist. Auch wenn es die Möglichkeit gibt, Markups anzulegen. Als Programmiersprache würde ich das aber lediglich, weil es interpretiert wird, nicht bezeichnen.*

TeX ist berechnungsvollständig und alles andere, als eine reine Markupsprache wie HTML. Damit liegt es mit PostScript etwa auf einer Ebene. Das ist auch kein Format, sondern eine Programmiersprache für Drucker. Eine Markupsprache ist dann LaTeX.

Zitat(Chris @ 06 Jul 2007, 17:59)
PDF indes ist eine vektorbasierte Auszeichnungssprache. Ähnelt wohl dem bekannten Ghostscript, dürfte aber umfangreicher sein.*


Du verwechselst eben den Interpreter mit der Sprache. Die Sprache heißt PostScript und ist wesentlich mächtiger, als PDF. Der Nachteil liegt jedoch darin, dass es als Programmiersprache für viele Anwendungen zu komplex und u.U. auch Systemabhängig ist. Deswegen hat Adobe das ganze ein wenig zusammengefasst und PDF erfunden. Irgendjemand sagte mal PDF ist PostScript ohne Programmierfähigkeiten. Das stimmt wohl nicht mehr ganz, aber dort liegen die Anfänge. Aber die meisten PDF-Dokumente werden mit dem Adobe Akrobat Destiller erstellt. Und dieses Programm wird mit PostScript gefüttert. Also muss PDF in PostScript darstellbar sein.

Zitat(Chris @ 06 Jul 2007, 17:59)
Allerdings würde ich PDF als wesentlich komplexer einschätzen als TeX.*


Die externe Konvertierung von PDF nach ODF sollte jedoch einfacher sein, als TeX, da TeX auf Low-Level ziemlich wenig kann und das nette alles von den Formaten (z.B. Plain, LaTeX, Context usw.) erlegdigt werden.


Zitat(Chris @ 06 Jul 2007, 17:59)
PDF ist ein Format, dass überall gleich aussieht.
TeX und HTML/XHTML sind Formate, die erst zur Interpretationszeit ihr Aussehen erhalten. Wie die beiden dann aussehen, hängt von den Stylesheets ab.*


TeX ist genauso, wie PostScript eine Programmiersprache, die nur Fonts kennt. Kein Markup und nichts. Der Witz daran ist, dass Markup usw. erst durch Programmierung hinzugefügt wird. Wenn Du willst könntest Du jede Interpretersprache dazu bringen als Textsatz-System zu fungieren. Das macht sich nur bei Makrosprachen wesentlich einfacher. Stylesheets gibts in TeX auch nicht. Sowas ähnliches gibts dann bei LaTeX.
Aber sowohl TeX, als auch Plain TeX, als auch LaTeX sehen überall gleich aus. Mag vielleicht daran liegen, dass TeX public domain ist, somit jeder dran rumprogrammieren darf.
skype66
Ich danke euch für die aufschlußreichen Antworten.

Sehe ich das richtig:eher PDF==>ODF und ODF==>PDF oder PDF==>ODF, PDF=>SVG, um auf einen gemiensamen Nenner zu kommen wink.gif
Grund: bzgl. PDF; sehr gute Dokumentation und öffentlicher Standard (PDF ist doch prorietär??? das Format ist zwar offen aber dennoch gibt es doch Restriktionen)

Ich werde diesen Schritt als wissenschaftliche Arbeit wagen.

im Voraus dankend auf ein letztes feedback und mit den besten Grüßen an die Gemeinde wink.gif