Neue Antwort schreiben 
 
Themabewertung:
  • 0 Bewertung(en) - 0 im Durchschnitt
  • 1
  • 2
  • 3
  • 4
  • 5
Tool zur Suche/Auflistung von verwendeten Abkürzungen in Dokumenten
freaked Offline
× ∫яεαкεδ εησυġн × ζιgнтѕтαя ×

Beiträge: 17.046
Registriert seit: Jul 2008
Beitrag #11
RE: Tool zur Suche/Auflistung von verwendeten Abkürzungen in Dokumenten
(07.11.2016 00:15)s4ndwichMakeR schrieb:  
(06.11.2016 22:44)Xaar schrieb:  
(06.11.2016 22:31)s4ndwichMakeR schrieb:  grep?

Falls diese Antwort ernstgemeint war: Beispiel gefällig?

Natürlich war die ernst gemeint. Für genau solche Anwendungen wurde grep gemacht. Musst dir nur einen regulären Ausdruck zurechtbasteln, z.B. [A-Z-]{2,} (müsste man mal noch schauen wegen Unicode). Das mit dem Punkt als Satzzeichen wird dir aber tatsächlich auf die Füße fallen. Wie soll man bspw. das ›bspw.‹ von dem ›fallen.‹ im letzten Satz unterscheiden können? … Hmm, eventuell über den Case des ersten Buchstabens des folgenden Wortes. Wie gesagt, ist alles eine Frage der richtigen Regexp.
und grep kann mit PDF und DOCX umgehen?

07.11.2016 08:39
Webseite des Benutzers besuchen Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
mrshadowtux
Unregistered

 
Beitrag #12
RE: Tool zur Suche/Auflistung von verwendeten Abkürzungen in Dokumenten
Für PDFs gibts pdfgrep.
07.11.2016 08:58
Diese Nachricht in einer Antwort zitieren
freaked Offline
× ∫яεαкεδ εησυġн × ζιgнтѕтαя ×

Beiträge: 17.046
Registriert seit: Jul 2008
Beitrag #13
RE: Tool zur Suche/Auflistung von verwendeten Abkürzungen in Dokumenten
wow wie mühsam...anstatt EIN grep machen, das alle brauchbaren formate lesen kann.. [Bild: facebook-cry-emoticon-crying-symbol.png]

(Dieser Beitrag wurde zuletzt bearbeitet: 07.11.2016 09:10 von freaked.)
07.11.2016 09:10
Webseite des Benutzers besuchen Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
s4ndwichMakeR Offline
Realitätsfeinmotoriker‮

Beiträge: 5.195
Registriert seit: Jul 2008
Beitrag #14
RE: Tool zur Suche/Auflistung von verwendeten Abkürzungen in Dokumenten
grep kann mit Plaintext umgehen. Das ist meiner Meinung nach ein gängiges Format für geschriebene Sprache, wenn nicht sogar das naheliegendste. Gerüchte besagen sogar, das sei ein freies Format und es müssen keine Lizenzgebühren dafür gezahlt werden. Oder besteht der nach Abkürzungen zu durchsuchende Text aus Höhlenmalerei als JPGs?

• • • – • – – • – –
07.11.2016 09:48
Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
freaked Offline
× ∫яεαкεδ εησυġн × ζιgнтѕтαя ×

Beiträge: 17.046
Registriert seit: Jul 2008
Beitrag #15
RE: Tool zur Suche/Auflistung von verwendeten Abkürzungen in Dokumenten
(07.11.2016 09:48)s4ndwichMakeR schrieb:  grep kann mit Plaintext umgehen. Das ist meiner Meinung nach ein gängiges Format für geschriebene Sprache, wenn nicht sogar das naheliegendste.

(╯°□°)╯︵ ( . 0 .)

docx/doc/pdf is nicht plain text

(Dieser Beitrag wurde zuletzt bearbeitet: 07.11.2016 21:22 von freaked.)
07.11.2016 21:22
Webseite des Benutzers besuchen Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
s4ndwichMakeR Offline
Realitätsfeinmotoriker‮

Beiträge: 5.195
Registriert seit: Jul 2008
Beitrag #16
RE: Tool zur Suche/Auflistung von verwendeten Abkürzungen in Dokumenten
(07.11.2016 21:22)freaked schrieb:  docx/doc/pdf is nicht plain text

Richtig, aber eher ich stunden-, tage- oder wochenlang nach einer Speziallösung suche und wenn ich es sowieso nicht automatisieren will, kopiere ich den Text aus dem Ausgangsdokument als Plaintext kurz raus. MS bietet eben nun mal leider innerhalb Word keine derartige Lösung an, außer vielleicht die Mustersuche in Verbindung mit VBA, damit man die Ergebnisse rausbekommt. Ich würde aber eher zu grep tendieren, weil: Das Suchmuster muss ich ohnehin eruieren, bei VBA kämen noch etliche Codezeilen dazu, die ich mir nicht schneller aus dem Ärmel schütteln könnte als ich die grep-Zeile eingetippt hätte.

• • • – • – – • – –
07.11.2016 21:36
Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
thosch97 Offline
All things have a right to grow

Beiträge: 9.843
Registriert seit: Feb 2010
Beitrag #17
RE: Tool zur Suche/Auflistung von verwendeten Abkürzungen in Dokumenten
Du willst einen regulären Kraftausdruck, der beschreibt, was du suchst, Punkt.

PGP-Key E384 009D 3B54 DCD3 21BF 9532 95EE 94A4 3258 3DB1 | S/MIME-Key 0x1A33706DAD44DA
G d-@ s+:- a--- C+++ UB+L++ P--- L++@ E-@>++ W+ N o? K? w>++ !O !M !V PS+++ PE-- Y+>++ PGP++>+++ !t 5? X? !R tv b+++>++++ DI !D G>+ e>+++ h !r>++ !z
„Die Aachener gelten als Erfinder des 4. Hauptsatzes der Thermodynamik: ‚Thermo schreibt man zweimal.“‘
“Saying that Java is good because it works on all platforms is like saying oral sex is good because it works on all sexes.”
„Es gibt 10 Sorten von Leuten: Die einen verstehen das Binärsystem, die anderen nicht.“
„Manche Männer lieben Männer, Manche Frauen eben Frauen; Da gibt's nix zu bedauern und nichts zu staunen; Das ist genau so normal wie Kaugummi kauen; Doch die meisten werden sich das niemals trauen“
07.11.2016 23:13
Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
DosAmp Offline
Anderes Zeigegerät

Beiträge: 12.219
Registriert seit: Jul 2008
Beitrag #18
RE: Tool zur Suche/Auflistung von verwendeten Abkürzungen in Dokumenten
(07.11.2016 21:36)s4ndwichMakeR schrieb:  Richtig, aber eher ich stunden-, tage- oder wochenlang nach einer Speziallösung suche und wenn ich es sowieso nicht automatisieren will, kopiere ich den Text aus dem Ausgangsdokument als Plaintext kurz raus.

Was ist pdftotext(1)?
Was ist antiword(1)?

CCITTグループ4またはZIP圧縮のモノクロ300dpiで最高の再現性
08.11.2016 00:29
Webseite des Benutzers besuchen Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
s4ndwichMakeR Offline
Realitätsfeinmotoriker‮

Beiträge: 5.195
Registriert seit: Jul 2008
Beitrag #19
RE: Tool zur Suche/Auflistung von verwendeten Abkürzungen in Dokumenten
(08.11.2016 00:29)DosAmp schrieb:  Was ist antiword(1)?

Ja, habe ich auch schon genutzt – war mir entfallen.

• • • – • – – • – –
08.11.2016 16:50
Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
Neue Antwort schreiben 


Gehe zu:


Benutzer, die gerade dieses Thema anschauen: 1 Gast/Gäste