Neue Antwort schreiben 
 
Themabewertung:
  • 0 Bewertung(en) - 0 im Durchschnitt
  • 1
  • 2
  • 3
  • 4
  • 5
Tool zur Suche/Auflistung von verwendeten Abkürzungen in Dokumenten
freaked Online
ILOVEBUNNY32=1

Beiträge: 14.940
Registriert seit: Jul 2008
Beitrag #11
RE: Tool zur Suche/Auflistung von verwendeten Abkürzungen in Dokumenten
(07.11.2016 01:15)s4ndwichMakeR schrieb:  
(06.11.2016 23:44)Xaar schrieb:  
(06.11.2016 23:31)s4ndwichMakeR schrieb:  grep?

Falls diese Antwort ernstgemeint war: Beispiel gefällig?

Natürlich war die ernst gemeint. Für genau solche Anwendungen wurde grep gemacht. Musst dir nur einen regulären Ausdruck zurechtbasteln, z.B. [A-Z-]{2,} (müsste man mal noch schauen wegen Unicode). Das mit dem Punkt als Satzzeichen wird dir aber tatsächlich auf die Füße fallen. Wie soll man bspw. das ›bspw.‹ von dem ›fallen.‹ im letzten Satz unterscheiden können? … Hmm, eventuell über den Case des ersten Buchstabens des folgenden Wortes. Wie gesagt, ist alles eine Frage der richtigen Regexp.
und grep kann mit PDF und DOCX umgehen?

[Bild: msinternet.gif] [Bild: beos_now.gif] [Bild: IE_ANI.GIF] [Bild: tumblr_p7uwh5gNuk1ujesf3o3_100.gif]
[Bild: freaked.banner.gif]
Erster PC 2003: AMD K6-2 500MHz, 320MB RAM, 40GB IBM HDD, 50x CD-ROM, 8x4x24 CD/RW, 100MBit LAN, 32MB ATi Rage 128 Pro
07.11.2016 09:39
Webseite des Benutzers besuchen Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
mrshadowtux
Unregistered

 
Beitrag #12
RE: Tool zur Suche/Auflistung von verwendeten Abkürzungen in Dokumenten
Für PDFs gibts pdfgrep.
07.11.2016 09:58
Diese Nachricht in einer Antwort zitieren
freaked Online
ILOVEBUNNY32=1

Beiträge: 14.940
Registriert seit: Jul 2008
Beitrag #13
RE: Tool zur Suche/Auflistung von verwendeten Abkürzungen in Dokumenten
wow wie mühsam...anstatt EIN grep machen, das alle brauchbaren formate lesen kann.. [Bild: facebook-cry-emoticon-crying-symbol.png]

[Bild: msinternet.gif] [Bild: beos_now.gif] [Bild: IE_ANI.GIF] [Bild: tumblr_p7uwh5gNuk1ujesf3o3_100.gif]
[Bild: freaked.banner.gif]
Erster PC 2003: AMD K6-2 500MHz, 320MB RAM, 40GB IBM HDD, 50x CD-ROM, 8x4x24 CD/RW, 100MBit LAN, 32MB ATi Rage 128 Pro
(Dieser Beitrag wurde zuletzt bearbeitet: 07.11.2016 10:10 von freaked.)
07.11.2016 10:10
Webseite des Benutzers besuchen Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
s4ndwichMakeR Offline
Realitätsfeinmotoriker‮

Beiträge: 5.060
Registriert seit: Jul 2008
Beitrag #14
RE: Tool zur Suche/Auflistung von verwendeten Abkürzungen in Dokumenten
grep kann mit Plaintext umgehen. Das ist meiner Meinung nach ein gängiges Format für geschriebene Sprache, wenn nicht sogar das naheliegendste. Gerüchte besagen sogar, das sei ein freies Format und es müssen keine Lizenzgebühren dafür gezahlt werden. Oder besteht der nach Abkürzungen zu durchsuchende Text aus Höhlenmalerei als JPGs?

• • • – • – – • – –
07.11.2016 10:48
Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
freaked Online
ILOVEBUNNY32=1

Beiträge: 14.940
Registriert seit: Jul 2008
Beitrag #15
RE: Tool zur Suche/Auflistung von verwendeten Abkürzungen in Dokumenten
(07.11.2016 10:48)s4ndwichMakeR schrieb:  grep kann mit Plaintext umgehen. Das ist meiner Meinung nach ein gängiges Format für geschriebene Sprache, wenn nicht sogar das naheliegendste.

(╯°□°)╯︵ ( . 0 .)

docx/doc/pdf is nicht plain text

[Bild: msinternet.gif] [Bild: beos_now.gif] [Bild: IE_ANI.GIF] [Bild: tumblr_p7uwh5gNuk1ujesf3o3_100.gif]
[Bild: freaked.banner.gif]
Erster PC 2003: AMD K6-2 500MHz, 320MB RAM, 40GB IBM HDD, 50x CD-ROM, 8x4x24 CD/RW, 100MBit LAN, 32MB ATi Rage 128 Pro
(Dieser Beitrag wurde zuletzt bearbeitet: 07.11.2016 22:22 von freaked.)
07.11.2016 22:22
Webseite des Benutzers besuchen Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
s4ndwichMakeR Offline
Realitätsfeinmotoriker‮

Beiträge: 5.060
Registriert seit: Jul 2008
Beitrag #16
RE: Tool zur Suche/Auflistung von verwendeten Abkürzungen in Dokumenten
(07.11.2016 22:22)freaked schrieb:  docx/doc/pdf is nicht plain text

Richtig, aber eher ich stunden-, tage- oder wochenlang nach einer Speziallösung suche und wenn ich es sowieso nicht automatisieren will, kopiere ich den Text aus dem Ausgangsdokument als Plaintext kurz raus. MS bietet eben nun mal leider innerhalb Word keine derartige Lösung an, außer vielleicht die Mustersuche in Verbindung mit VBA, damit man die Ergebnisse rausbekommt. Ich würde aber eher zu grep tendieren, weil: Das Suchmuster muss ich ohnehin eruieren, bei VBA kämen noch etliche Codezeilen dazu, die ich mir nicht schneller aus dem Ärmel schütteln könnte als ich die grep-Zeile eingetippt hätte.

• • • – • – – • – –
07.11.2016 22:36
Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
thosch97 Offline
All things have a right to grow

Beiträge: 9.846
Registriert seit: Feb 2010
Beitrag #17
RE: Tool zur Suche/Auflistung von verwendeten Abkürzungen in Dokumenten
Du willst einen regulären Kraftausdruck, der beschreibt, was du suchst, Punkt.

PGP-Key E384 009D 3B54 DCD3 21BF 9532 95EE 94A4 3258 3DB1 | S/MIME-Key 0x1A33706DAD44DA
G d-@ s+:- a--- C+++ UB+L++ P--- L++@ E-@>++ W+ N o? K? w>++ !O !M !V PS+++ PE-- Y+>++ PGP++>+++ !t 5? X? !R tv b+++>++++ DI !D G>+ e>+++ h !r>++ !z
„Die Aachener gelten als Erfinder des 4. Hauptsatzes der Thermodynamik: ‚Thermo schreibt man zweimal.“‘
“Saying that Java is good because it works on all platforms is like saying oral sex is good because it works on all sexes.”
„Es gibt 10 Sorten von Leuten: Die einen verstehen das Binärsystem, die anderen nicht.“
„Manche Männer lieben Männer, Manche Frauen eben Frauen; Da gibt's nix zu bedauern und nichts zu staunen; Das ist genau so normal wie Kaugummi kauen; Doch die meisten werden sich das niemals trauen“
08.11.2016 00:13
Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
DosAmp Offline
Flegkano

Beiträge: 11.971
Registriert seit: Jul 2008
Beitrag #18
RE: Tool zur Suche/Auflistung von verwendeten Abkürzungen in Dokumenten
(07.11.2016 22:36)s4ndwichMakeR schrieb:  Richtig, aber eher ich stunden-, tage- oder wochenlang nach einer Speziallösung suche und wenn ich es sowieso nicht automatisieren will, kopiere ich den Text aus dem Ausgangsdokument als Plaintext kurz raus.

Was ist pdftotext(1)?
Was ist antiword(1)?

[Bild: stempel.png]
08.11.2016 01:29
Webseite des Benutzers besuchen Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
s4ndwichMakeR Offline
Realitätsfeinmotoriker‮

Beiträge: 5.060
Registriert seit: Jul 2008
Beitrag #19
RE: Tool zur Suche/Auflistung von verwendeten Abkürzungen in Dokumenten
(08.11.2016 01:29)DosAmp schrieb:  Was ist antiword(1)?

Ja, habe ich auch schon genutzt – war mir entfallen.

• • • – • – – • – –
08.11.2016 17:50
Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
Neue Antwort schreiben 


Gehe zu:


Benutzer, die gerade dieses Thema anschauen: 1 Gast/Gäste