Willkommen

Navigation


Statistik
8295
Benutzer online
Mitglieder: 1.852.423
Themen: 670.141
Beiträge: 4.119.925

 
Antwort Themen-Optionen
Alt 23.01.12, 09:01   #301 (Permalink)
Benutzerbild von notimp
Threadstarter
Mitglied seit: Sep 2008
Beiträge: 1.422
notimp ist offline
notimp
Member
 
[TUT] Pdfs in Epub/Mobi umwandeln

Ich sehe gerade etwas schauriges. xpdfs pdf2text, also das Modul das so gut wie alle "non OCR" Wandler nutzen um Text aus pdf zu extrahieren, führt Fehler in Text ein, wo sie in der copy/paste Version des Textes aus pdf noch nicht vorhanden waren. Und zwar bei Leerzeichen.

Das ist neu für mich, da es bedeutet, dass pdf2text ebenfalls "interpretiert". Zumindest bei Positionsangaben. Es ist also ebenfalls eine Form der "Character Recognition". Aber bitte vergesst das sofort wieder...

Mit Zitat antworten Beitrag melden
   
Alt 28.01.12, 19:19   #302 (Permalink) Top
Benutzerbild von Chequer
Mitglied seit: Nov 2010
Beiträge: 8
Chequer ist offline
Chequer
Member
 
[TUT] Pdfs in Epub/Mobi umwandeln

Hallo!

Also wenn man ebooks kauft, dann finde ich immer schön, dass der Text nicht oben und unten und links und rechts an die Ränder "stößt". Ich habe jetzt selbst versucht mit meinen eigens erstellten epubs das nachzumachen, aber ich kriegs einfach nicht hin. Ich habe mir die stylesheets von den gekauften epubs angeschaut, aber ich blicke einfach nicht hinter das System.
Dann hatte ich versucht, einfach das hier zu nehmen:


body{margin-left:5%;margin-right:5%;margin-top:5%;margin-bottom:5%}

p{text-indent:1%;margin-left:4pt;margin-right:4pt;margin-top:6pt;margin-bottom:6pt}

Aber das verändert irgendwie nichts.

Wo muss ich denn hinschreiben, dass ich will, dass der Text oben und unten undl links und rechts, sagen wir ca. 2 cm vom Rand wegbleibt?

Danke!

Mit Zitat antworten Beitrag melden
   
Alt 28.01.12, 19:25   #303 (Permalink) Top
Benutzerbild von wurzelkitt
Mitglied seit: Nov 2010
Beiträge: 242
wurzelkitt ist offline
wurzelkitt
Member
 
[TUT] Pdfs in Epub/Mobi umwandeln

Das ist schon richtig, aber nachfolgende Klassen überschreiben das evtl wieder.

body {
margin: 1em !important;
}

Mit Zitat antworten Beitrag melden
   
Alt 28.01.12, 19:43   #304 (Permalink) Top
Benutzerbild von Chequer
Mitglied seit: Nov 2010
Beiträge: 8
Chequer ist offline
Chequer
Member
 
[TUT] Pdfs in Epub/Mobi umwandeln

wo sind denn die klassen gekennzeichnet, die das überschreiben. woran erkenne ich das? wahrscheinlich bräuchte ich um eine einfache antwort zu verstehen auch kenntnisse in html, die ich leider nicht habe.
Ich verändere die zahlen und in sigil kann ich auch eine veränderung sehen, aber nicht im ereader. Ich hab einen kobo, falls das was zur sache tut

Mit Zitat antworten Beitrag melden
   
Alt 28.01.12, 21:19   #305 (Permalink) Top
Benutzerbild von wurzelkitt
Mitglied seit: Nov 2010
Beiträge: 242
wurzelkitt ist offline
wurzelkitt
Member
 
[TUT] Pdfs in Epub/Mobi umwandeln

Der Kobo ist in der Lage, CSS des Buches zu überschreiben und eigene Einstellungen zu verwenden. Ich empfehle mal das Handbuch zu lesen.

Mit Zitat antworten Beitrag melden
   
Alt 28.01.12, 21:30   #306 (Permalink) Top
Benutzerbild von TotalMayhem
Mitglied seit: Mar 2010
Beiträge: 512
TotalMayhem ist offline
TotalMayhem
Member
 
[TUT] Pdfs in Epub/Mobi umwandeln

Zitat:
Zitat von Chequer Beitrag anzeigen
Ich habe jetzt selbst versucht mit meinen eigens erstellten epubs das nachzumachen, aber ich kriegs einfach nicht hin.
Schau dir mal Jutoh an (ich hab ne portable/sandboxed Version im ebook software thread geposted), vielleicht kommt dir das entgegen, da kannste wunderbar an deinen Styles rumbasteln, ohne dass du auch nur eine Zeile Code zu gesicht belommst, das duerfte Dir entgegenkommen.

(Hoffentlich ist Englisch kein Problem fuer dich)

Ich benutz das Teil um ebooks auf die schnelle fuer mein KOBO 'aufzuhuebschen'. Bedienung ist eigentlich kinderleicht.

 

Alles wird gut!
Mit Zitat antworten Beitrag melden
   
Alt 01.02.12, 18:56   #307 (Permalink) Top
Benutzerbild von Chequer
Mitglied seit: Nov 2010
Beiträge: 8
Chequer ist offline
Chequer
Member
 
[TUT] Pdfs in Epub/Mobi umwandeln

Danke für den Tip, werds mir gleich mal anschauen! Und da ich in Canada lebe, geht das mit Englisch auch ganz gut

Mit Zitat antworten Beitrag melden
   
Alt 01.02.12, 20:14   #308 (Permalink) Top
Benutzerbild von TotalMayhem
Mitglied seit: Mar 2010
Beiträge: 512
TotalMayhem ist offline
TotalMayhem
Member
 
[TUT] Pdfs in Epub/Mobi umwandeln

Zitat:
Zitat von Chequer Beitrag anzeigen
Danke für den Tip, werds mir gleich mal anschauen! Und da ich in Canada lebe, geht das mit Englisch auch ganz gut
Da Jutoh keinen eigenen Betrachter hat, solltest du einen EPUB Viewer auf deinem Rechner haben, damit du via Compile > Launch das Resultat gleich anschauen kannst. (Ich habe CoolReader 3 mit EPUBs assoziiert)

 

Alles wird gut!
Mit Zitat antworten Beitrag melden
   
Alt 13.02.12, 10:22   #309 (Permalink) Top
Benutzerbild von Angy2004
Mitglied seit: Dec 2008
Beiträge: 17
Angy2004 ist offline
Angy2004
Member
 
[TUT] Pdfs in Epub/Mobi umwandeln

Hi, ich bin gerade dabei ein PDF in ein epub umzuwandeln.

Jetzt stehe ich aber vor dem Problem mit dem Program "Sigil". Habe die HTML mit Sigil geöffnet und bin in den Bearbeitungsmodus gewechselt. Jetzt steht bei mir "font31" bin dann auf "Bearbeiten - Suchen amp Ersetzen. Dann habe ich den Zeilencode "(<p><span class="font[^31]( |sgc-\d){0,3}">(<a id="bookmark\d"></a>){0,1}(\s*|\S*){1,15}</span></p>\s*<p><span class="font31)">" unten bei Suche eingeben und bei Ersetzen "\1 font3">" dann auf Replace all. Leider sagt mir das Program jetzt aber nur "No placements made" Was mache ich den falsch ??


Würde mich sehr über eure Hilfe freuen.


mfg
Angy2004

Mit Zitat antworten Beitrag melden
   
Alt 13.02.12, 10:30   #310 (Permalink) Top
Benutzerbild von SP()()KY
Mitglied seit: Jul 2009
Beiträge: 351
SP()()KY ist offline
SP()()KY
Connaisseur
 
[TUT] Pdfs in Epub/Mobi umwandeln

abhängig von deiner sigil version tippe ich mal das du im falschen "modus" operierst.

Du kannst "normal", "case sensitive", regular expression" und bei meiner version auch noch "Regex Dotall" auswählen.

 

Das Lemsche Gesetz:

Niemand liest etwas; wenn er etwas liest, versteht er es nicht; wenn er es versteht, vergißt er es sofort.
aus gegebenen Anlass.... bei Downs meiner Files bitte PN
Mit Zitat antworten Beitrag melden
   
Alt 13.02.12, 10:39   #311 (Permalink) Top
Benutzerbild von Angy2004
Mitglied seit: Dec 2008
Beiträge: 17
Angy2004 ist offline
Angy2004
Member
 
[TUT] Pdfs in Epub/Mobi umwandeln

Vielen Dank erstmal für den Tipp.

Nur wo kann ich diesen umstellen und welche brauche ich ? Wo finde ich den die englische Version ?

@Edit Habe den Modus in "Regulärer Ausdruck" geändert, leider immer noch die gleiche Meldung "No placements made" und geändert hat das Program nichts

Mit Zitat antworten Beitrag melden
   
Alt 13.02.12, 22:43   #312 (Permalink) Top
Benutzerbild von Angy2004
Mitglied seit: Dec 2008
Beiträge: 17
Angy2004 ist offline
Angy2004
Member
 
[TUT] Pdfs in Epub/Mobi umwandeln

Kann mir denn keiner helfen ???? der Zeilenumbruch stimmt überhaupt nicht :-((((

Mit Zitat antworten Beitrag melden
   
Alt 14.02.12, 08:13   #313 (Permalink) Top
Benutzerbild von wurzelkitt
Mitglied seit: Nov 2010
Beiträge: 242
wurzelkitt ist offline
wurzelkitt
Member
 
[TUT] Pdfs in Epub/Mobi umwandeln

Zitat:
Zitat von Angy2004 Beitrag anzeigen
Kann mir denn keiner helfen ???? der Zeilenumbruch stimmt überhaupt nicht :-((((
Helfen könnte man, wenn du Grundkenntnisse in regulären Ausdrücken hättest.

Mit Zitat antworten Beitrag melden
   
Alt 14.02.12, 22:12   #314 (Permalink) Top
Benutzerbild von Angy2004
Mitglied seit: Dec 2008
Beiträge: 17
Angy2004 ist offline
Angy2004
Member
 
[TUT] Pdfs in Epub/Mobi umwandeln

Zitat:
Zitat von wurzelkitt Beitrag anzeigen
Helfen könnte man, wenn du Grundkenntnisse in regulären Ausdrücken hättest.

Sorry von mir dafür Hast natürlich recht, werde in Zukunft Besserung geloben.

Habe es nach dem bebilderten Tut aus dem ersten Thread gemacht, hat alles soweit geklappt nur mit dem Prog "Sigil" komme ich nicht so recht klar.
Habe mir Version 0.4.2 auf dem Rechner installiert, da bei der neusten Version "Strg-H" zum Beispiel nicht mehr geht. Bin in dem Tut https://docs.google.com/documen...r6LUf5nSN0 bei Punkt 10 hängen geblieben um die Schriftgröße anzupassen, habe den "Code" eingeben und aus den Rot gekennzeichten "Font3" ein "Font7" gemacht da es bei diesem PDF (HTML) am meisten vorkommt. Habe auch alle weitern Einstellung so wie im Tut vorgenommen wie z.B bei "replace with"\1 font3">. Leider bekommt ich immer die Meldung "The Search term was replaced 0 time"


Wäre super wenn ihr bei meinem Bedienerfehler helfen könntest. ^^


mfg
Angy2004

Geändert von Angy2004 (14.02.12 um 22:22 Uhr).
Mit Zitat antworten Beitrag melden
   
Alt 15.02.12, 07:56   #315 (Permalink) Top
Benutzerbild von wurzelkitt
Mitglied seit: Nov 2010
Beiträge: 242
wurzelkitt ist offline
wurzelkitt
Member
 
[TUT] Pdfs in Epub/Mobi umwandeln

Zitat:
Zitat von Angy2004 Beitrag anzeigen
Wäre super wenn ihr bei meinem Bedienerfehler helfen könntest. ^^
Zu einem regulären Ausdruck gehört immer auch der exakte Ist-Zustand und keine nebulöse Umschreibung, ansonsten kann man nicht erkennen, warum dein Regex nicht greift. Und natürlich auch der Soll-Zustand.

Der häufigste Fehler warum Regexe nicht greifen sind Blanks am Ende des regulären Ausdrucks, die im Quelltext aber nicht vorkommen. Sowas sieht man nicht sofort, aber nach dem Blank wird halt gesucht. Ansonsten überläd man einen Regex nicht, sondern splittet Aufgaben in kleinere Regexe, die man dann nacheinander ablaufen läßt. Zumindest wenn man in Regexen nicht Sattelfest ist.

Mit Zitat antworten Beitrag melden
   
Alt 15.02.12, 09:30   #316 (Permalink) Top
Benutzerbild von Angy2004
Mitglied seit: Dec 2008
Beiträge: 17
Angy2004 ist offline
Angy2004
Member
 
[TUT] Pdfs in Epub/Mobi umwandeln

Vielen Dank erstmal für deine Hilfe Wurzelkitt. Habe mal eine Zeile rauskopiert

Zitat:
<p class="sgc-6"><span class="font7">Um Persönlichkeitsrechte einiger Akteure zu wahren, wurden Namen,<br />
Orte und Personenbeschreibungen verfremdet. Alle in diesem Buch<br />
dargestellten Ereignisse, Szenen und Dialoge haben sich aber so wie<br />
beschrieben oder in sehr ähnlicher Weise abgespielt.</span></p>
Was genau müsste ich den in dem Code verändern ? Stehe da im moment voll auf dem Schlau


mfg
Angy2004

Mit Zitat antworten Beitrag melden
   
Alt 15.02.12, 10:01   #317 (Permalink) Top
Benutzerbild von wurzelkitt
Mitglied seit: Nov 2010
Beiträge: 242
wurzelkitt ist offline
wurzelkitt
Member
 
[TUT] Pdfs in Epub/Mobi umwandeln

Und was soll daraus werden?

Mit Zitat antworten Beitrag melden
   
Alt 17.02.12, 10:14   #318 (Permalink) Top
Benutzerbild von wubelo
Mitglied seit: Aug 2011
Beiträge: 12
wubelo ist offline
wubelo
Member
 
[TUT] Pdfs in Epub/Mobi umwandeln

Bei mir funktioniert schon gleich die erste RegEx in der Anleitung nicht (es wird nichts gefunden):

(<p><span class="font[^2]( |sgc-\d){0,3}">(<a id="bookmark\d"></a>){0,1}(\s*|\S*){1,15}</span></p>\s*<p><span class="font2)">

Die Textblöcke mit dem überwiegend vorkommenden font-tag sehen bei mir so aus:

<p><span class="font2 sgc-2">Auch Mord ist kein Problem - je nachdem, wie man ihn verkauft.</span></p>

Mit Zitat antworten Beitrag melden
   
Alt 17.02.12, 11:08   #319 (Permalink) Top
Benutzerbild von wurzelkitt
Mitglied seit: Nov 2010
Beiträge: 242
wurzelkitt ist offline
wurzelkitt
Member
 
[TUT] Pdfs in Epub/Mobi umwandeln

So geht das nicht. Ihr benutzt ein Tutorial, das empfindlich auf Versionen und eingesetze Programme reagiert. Die regulären Ausdrücke sind hochgradig speziell angepasst. Kleinste Abweichungen führen dazu das nichts mehr gefunden wird.

Ohne zumindest grundlegende Kenntnisse von regulären Ausdrücken kommt ihr nicht weiter. Ebenso sind grundlegende Kenntnisse in HTML und CSS notwendig. Ohne diese Kenntnisse kann man noch froh sein, wenn nichts funktioniert. Ein falscher/ungenauer/nicht passender Regex kann einem auch das gesamte Dokument gründlich in die Pfanne hauen.

Bei Problemen mit regulären Ausdrücken gehört grundsätzlich dazu:

a) wie sieht die Quelle aus
b) wie sieht der Regex aus
c) was will ich erreichen

Weder zu a noch zu b noch zu c passen dabei irgendwelche nebulösen Umschreibungen wie "Ich will einen anderen Font haben" oder "Ich will andere Abstände haben". Darauf wird der Regex schliesslich nicht angewendet.

Der Regex von Angy2004 ist viel zu komplex für die Quelle, die Hälfte davon kann man in diesem Fall vorneherein weglassen. Aber wenn keiner sagt wo er genau hinwill kann man nicht helfen. Mit ein bisschen Kenntnis baut man sich dann seinen eigenen Regex, den man dann auch versteht, was er macht.

Es ist schon kompliziert genug zu helfen selbst wenn man a), b) und c) exakt vor die Nase gesetzt bekommt, denn schon ein einzelner Blank zuviel oder zuwenig kann schon zum es-geht-gar-nichts oder zum Chaos führen.

Es gibt im Web genügend Seiten, die einem die Anfänge von regulären Ausdrücken beibringen. Einen Königsweg gibt es da nicht.

Mit Zitat antworten Beitrag melden
   
Alt 18.02.12, 20:47   #320 (Permalink) Top
Benutzerbild von wubelo
Mitglied seit: Aug 2011
Beiträge: 12
wubelo ist offline
wubelo
Member
 
[TUT] Pdfs in Epub/Mobi umwandeln

Ich habe mich genau an die Anleitung gehalten und wollte den RegEx auf den von Finereader generierten Code loslassen.

Mir ist aufgefallen, dass Finreader im CSS absolute Größenangaben für die Schriftgrößen vergibt. Das führt auf meinem Reader dazu, dass die Schrift winzig klein ist und sich auch nicht vergrößern lässt. Ich habe die font Formatierungen dann mal ganz aus dem CSS entfernt damit die Schrift in der Standardgröße in Standardschrift dargestellt wird.

Mit Zitat antworten Beitrag melden
   
Alt 18.02.12, 21:05   #321 (Permalink) Top
Benutzerbild von wurzelkitt
Mitglied seit: Nov 2010
Beiträge: 242
wurzelkitt ist offline
wurzelkitt
Member
 
[TUT] Pdfs in Epub/Mobi umwandeln

Das tritt dann auf, wenn die Fontgröße in pt or px angegeben ist. Dann skalieren manche Reader nicht mehr. Du hättest in der CSS einfach nur die Einheit auf em ändern müssen (1 em ) oder nur font-size löschen brauchen. Das benutzen einer Regex ist für sowas nicht angebracht.

Mit Zitat antworten Beitrag melden
   
Alt 19.02.12, 11:47   #322 (Permalink) Top
Benutzerbild von wubelo
Mitglied seit: Aug 2011
Beiträge: 12
wubelo ist offline
wubelo
Member
 
[TUT] Pdfs in Epub/Mobi umwandeln

Das habe ich auch so gemacht. Den RegEx ausdruck wollte ich nach der Anleitung von notimp verwenden um das HTML anzupassen.

Mit Zitat antworten Beitrag melden
   
Alt 19.02.12, 12:21   #323 (Permalink) Top
Benutzerbild von wurzelkitt
Mitglied seit: Nov 2010
Beiträge: 242
wurzelkitt ist offline
wurzelkitt
Member
 
[TUT] Pdfs in Epub/Mobi umwandeln

Das HTML ist sicherlich Dumpfbackenmässig, ein span innerhalb eines p-Elementes über den gesamten Inhalt Unsinn. Aber wie gesagt, Regexe sind sehr empfindlich, ein zuviel mitgenommenes Blank beim c&p kann schon zum Nicht-funktionieren führen. Und diese Blanks sind naturgemäß schwer zu sehen

Mit Zitat antworten Beitrag melden
   
Alt 21.02.12, 13:46   #324 (Permalink) Top
Benutzerbild von wubelo
Mitglied seit: Aug 2011
Beiträge: 12
wubelo ist offline
wubelo
Member
 
[TUT] Pdfs in Epub/Mobi umwandeln

Wann und wie binde ich denn am besten ein Cover in das ePUB ein? Ich meine jetzt nicht dieses kleine Vorschaubild was man z.B. in Calibre automatisiert einfügen kann sondern quasi die erste Seite im ePUB.

Abby Finereader erzeugt ja immer font Einträge mit festen Größen im CSS. Wenn ich jetzt im Buch viele verschiedene Schriftgrößen habe z.B. Bildunterschriften etc. will ich den ganzen Block nicht einfach komplett rausnehmen, weil ja sonst alles gleich groß angezeigt wird. Sollte man dann die pt Angaben durch vergleichbare em Angaben ersetzen und von dem zu 90% vorkommenden font Eintrag mit 1em anfangen oder wie macht ihr das? Sollte man die Schriftarten am besten rausnehmen, da sie ja nicht mit eingebettet sind?

Der erste RegEx Ausdruck aus der Anleitung funktioniert bei mir auch bei einem weiteren Test mit Tiffs statt PDF als Quelle für Abby Finereader nicht. Ich habe die Zeile genau wie angegeben ohne Leerzeichen und nur mit geänderter font Nummer in Sigil eingefügt und auf "Regulärer Ausdruck" umgestellt aber es wird nichts gefunden (No matches found).

(<p><span class="font[^9]( |sgc-\d){0,3}">(<a id="bookmark\d"></a>){0,1}(\s*|\S*){1,15}</span></p>\s*<p><span class="font9)">

Mit Zitat antworten Beitrag melden
   
Alt 21.02.12, 14:12   #325 (Permalink)
Benutzerbild von wurzelkitt
Mitglied seit: Nov 2010
Beiträge: 242
wurzelkitt ist offline
wurzelkitt
Member
 
[TUT] Pdfs in Epub/Mobi umwandeln

Was hast du an "Der reguläre Ausdruck ist sensibel und heftig abhängig von den eingesetzten Programmversionen" nicht verstanden?

Was hast du an "Zur Hilfe an einem regulären Ausdruck ist nicht nur der reguläre Ausdruck, sondern auch der Code vorher wichtig und das was rauskommen soll" nicht verstanden?

Manchmal frage ich mich, wozu ich solcherlei Sachen schreibe...

Wenn ich PDFs mit Abby ins ePub Format wandele habe ich so ziemlich alles abgestellt, es werden keine keine Fonts und auch so gut wie keine Formatierungen mitgenommen. Das Resultat ist dann eine ziemlich armselige ePUB Datei. Den Rest erledige ich in SIGIL. Ich merge alle html Files zusammen, und binde dann ein mit der Zeit gewchsenes Standardstylesheet ein, ebenso eine fertige coverpage.html. Das Cover suche ich im Web heraus, und füge es mit SIGIL ebenso ein. coverpage und cover.jpg bekommen das Attribut cover zugewiesen.
Überschriften werden mit Regexen gesucht und in das h2 Element umgewandelt. Unterkapitel eben in h3, h4 usw.
Dann trenne ich das html an entsprechenden Stellen auf, so dass ich jetzt mehrere html Seiten erhalte: coverpage, titlepage, impressum, widmung. Etwaige Inhaltsverzeichnisse werden entfernt. Die obigen Dateien werden dann aufgehübscht, wobei evtl neue CSS Regeln ins Stylesheet wandern.
Den Rest, der jetzt nur noch den reinen Buchtext erhält, wird per Regex mit chapterbreak Markern angereichert und mit Sigil an Kapitelgrenzen aufgebrochen. Dann noch kurz Sichtprüfung und fertig.
Am meisten Arbeit machen dabei die nicht-Textseiten wie cover, titel und impressum, widmung.
Im Gegensatz zu notimp verwende ich kein Atlantis oder sowas dazwischen.

Ohne dass du dir Grundlagen in regulären Ausdrücken, (x)html und CSS aneignest wirst du nicht viel Erfolg haben. Es ist eine Eigenart von regulären Ausdrücken, dass insbesonders komplexere Ausdrücke nur noch von demjenigen verstanden werden, der sie erstellt hat.
Kleiner Hinweis noch: notimp zB verwendet Sigil 042, ich noch die 034. Mittlerweile exitiert bereits die 052, und mit der 050er hat sich die Regex-Engine auf PCRE geändert. Alleine das kann schon ein Grund sein, warum das bei dir nichts wird. Aber ich sagte ja schon, Programmversionen und so....

Mit Zitat antworten Beitrag melden
   
Antwort


 

Ähnliche Themen
Thema Forum
Cody Mcfadyen - Die Blutline bis Ausgelöscht (PDF,PRC/MOBI,EPUB) Unterhaltung


Themen-Optionen



Jetzt registrieren


Registrieren | Forum-Mitarbeiter | Kontakt | Nutzungsbedingungen

Alle Zeitangaben in WEZ +1. Es ist jetzt 14:37 Uhr.

All trademarks are the property of their respective owners.
Copyright ©2008 - 2012 BoerseBZ