Home

- Universität Wien

image

Contents

1. 55 Abb 27 ProTerm Addheu Term Fenster AAA 55 Abb 28 ProTerm Neuer Eintrag in Tembank nn 56 Abb 29 ProTerm TermBank ran 58 Abb 30 ProTerm TermBank Manager 59 Abb 31 ProTerm TermBank Termbankinhallt AA 60 Abb 32 ProTerm TermBank Begriffsebene 61 Abb 33 ProTerm TermBank Gporachebene 61 Abb 34 ProTerm TermBank Temebene 62 Abb 35 Microsoft Access Export der Extraktionsergebnisse 63 Abb 36 Microsoft Access Export via Word HIE Datei 64 Abb 37 Exportergebnis in Word HIE Date Auszug 65 Abb 38 Exportergebnis in Microsoft Excel Auszug 66 Abb 39 ProTerm Stopp Wort EditOr 1 69 Abb 40 ProTerm Stopp Wort Editor U N 69 Abb 41 ProTerm Erstellen neuer Stopp Wort Listen 70 Abb 42 ProTerm Manuelles Hinzuf gen von Gtopp MW rtenm arcano 71 94 Abb Abb Abb Abb Abb Abb Abb Abb Abb Abb Abb 43 44 45 46 47 48 49 50 51 52 53 ProTerm Importieren von StW Listen in Tet Fommat 71 Generieren von Stopp W rtern w hrend des Auswahlverfahrens 1 73 Generieren von Stopp W rtern w hrend des Auswahlverfahrens 11 74 ProTerm NewTerm Benennung bearbeiten 75 ProTerm
2. Summen a y erstellen 1 Datendefinition anzeigen Zur ckgeben Alle y 2 Parameter Ergebnisse JE Abfragesetup Einblenden Ausblenden termbank begriff _TermBank_TermStar E 1 _TermBank_TermStar_not_doppelte_quelle Y PT_PINID Y PT_PBR_ID Y PTTE_ID 7 Y PT_BEG_ID mu ees er Ber mimos 1_begriffsebene gt abfrage4_fachgebiet TermBank PT_TB_BEZ Projekt PT_PIN_BEZ Sachgebiet not ji Anmerkung_Begriff de_Benennung de_Quelle de d AUSGEBLENDET Tabelle ptb_termbank de_benennung de_benennung Sortierung Anzeigen _ det und kont Kriterien oder AVL_Benennungen AVL_TB_EXPORT_1 AVL_TB_EXPORT_2_20091124 de_benennung L ffnen Pi Excel en_benennung 24 Entwurfsansicht D SharePoint Liste normierung alle Exportieren gt VOLLSTANDIG 3 Daten ber E Mail sammeln und aktualisieren 9 9 9 E 9 9 E 9 9 Access Datenbank Textdatei XML Datei ODBC Datenbank Snapshot Viewer HTML Dokument dBASE Datei Umbenennen In dieser Gruppe ausblenden L schen A Ausschneiden Kopieren a Einf gen Objekteigenschaften Paradox Datei Lotus 1 2 3 Datei Seriendruck mit Microsoft Office Word EEF SEFE Abb 36 Microsoft Access Export via Word RTF Datei 64 ProTerm AVL_INDI Indizierte notjet Motorpar amp Bei 26450 ZIERTECH
3. Pers nliche Interessen Berufliche und pers nliche Weiterbildung Lesen Kaffee trinken Reisen Inline Skating Radfahren Fu ball Eishockey Immoconsult Leasingges m b H Sports Experts www sports experts at Osterreich Pr sidentschaft der EU www eu2006 at IIHF World Championship www lihf com 99 100
4. Abb 23 ProTerm NewTerm Auswahlmen Farbkodierung 49 ProTerm ProTerm Datei ProTerm Administration Info Filter AvL_INDIZIERTECHNIK_de zl INDIZIERTECHNIK_ JAVLINDIZIERTECHNIK de zl prolerm Auswahimend Differenz e Einlesedatum 2009 08 27 23 48 AT2645D_04_IndiPar_Mess we Positionen Tastenkombination new Messbereichs verwendeten Ablauf Abfrage Linien Horizontal AVL_INDIZIERTECHNIK Abb 23 ProTerm NewTerm Auswahlmen Farbkodierung i Farbkodierung Neue Benennungen sind in wei er Farbe hinterlegt akzeptierte Termini in gr ner und Stopp W rter in roter Farbe siehe Fehler Verweisquelle konnte nicht gefun den werden Werden die Benennungen nach dem Status sortiert oder wird im Auswahlmen eine Kategorisierung ausgew hlt so werden die Benennungen in den jeweiligen Farben hinterlegt angezeigt 50 ProTerm 7 2 5 2Kombinieren der Parameter Die Parameter Benennung Status Doc Max ZLen Len k nnen individuell mitein ander kombiniert und parallel angewendet werden Dies erm glicht es dem Termino logen das Einleseergebnis nach Belieben zu filtern und Einschr nkungen f r das Anzeigen des Einleseergebnisses aufzustellen ProTerm Datei ProTerm Administration Info P Teil rm Filter AVL_INDIZIERTECHNIK_de y Einlesedatum 625D_04_IndiPar_Messperameteredtor_SPLIT y C Differenz ep nme NewTerm Versuche absteigend darunter
5. e e txt e html e xml e alle Microsoft Office Formate Folgende Zeichens tze k nnen in ProTerm eingelesen und bearbeitet werden e ISO 8859 1 bis 16 e VISCII e ASCII e UTF8 7 1 Vorbereitende Ma nahmen Terminologie zu erkennen und sie als solche zu qualifizieren war eine der gr ten Herausforderungen im Rahmen dieser Masterarbeit Die Autorin musste sich daher vor Beginn der TE mit den zur Verf gung gestellten Dokumentationen und den darin behandelten Fachgebieten vertraut machen um TK ausfindig zu machen Um so rasch wie m glich die TK identifizieren zu k nnen wurden vor Beginn der ersten TE die bestehenden Eintr ge der AVL Terminologie datenbank und der Text der Doku mentationsgruppe CAMEO gewissenhaft studiert Somit konnte sich die Autorin in das Fachgebiet einarbeiten und sich ein Bild von dem geforderten Fachlichkeitsgrad der TK machen Ein Telefongespr ch mit Elisabeth Stossier die seit mehr als 20 Jahren f r AVL als bersetzerin t tig ist hat dazu beigetragen einen Einblick zu gewinnen wie im Zu ge der bersetzungen neue Termini identifiziert die zielsprachlichen quivalente 23 ProTerm eruiert und Terminologie verwaltet werden Frau Stossier arbeitet mit dem berset zungstool Transit Firma STAR und dem Textverarbeitungstool FrameMaker Ihre zweisprachige Terminologiesammlung verwaltet sie in Microsoft Office Word Listen die sie bei Bedarf mit dem Suchtool TextPad nach bereits vorh
6. Erkennung von h ufig verwendeten Textstrukturen wie Definitionen und erl u ternden Kontexten z B X wird als bezeichnet oder X besteht aus vgl Pearson 1998 Saf 2004 4 3 6 Hybride Extraktionsverfahren TETs die rein linguistisch oder rein statistisch arbeiten scheitern bei der L sung vieler typischer Probleme der TE Da diese Probleme zum Teil sehr unterschiedlicher Natur sind scheint allein eine Kombination beider Ans tze die Entwicklung effizienter TETs zu erm glichen Deshalb wird der so genann te hybride Ansatz wegen seiner unerforschten M glichkeiten von mehreren Autoren als die einzige viel versprechende Methode angesehen Zielinski und Safar 2005 Bei den hybriden Extraktionsverfahren werden also zwei oder mehr der oben ange f hrten Extraktionsverfahren kombiniert Das Terminologieextraktionsverfahren das im Zuge dieser Masterarbeit zur Anwendung kam kann als toolgest tzt bezeichnet 13 Terminologieextraktion und dem hybriden Extraktionsverfahren zugeordnet werden Es wurden das statisti sche und das manuelle Extraktionsverfahren kombiniert Der detaillierte Ablauf des Extraktionsverfahrens mit ProTerm wird in Kapitel 7 vorgestellt 4 3 7 Evaluierungskriterien f r Terminologieextraktionstools TETs k nnen anhand verschiedener Kriterien bewertet werden Neben grund s tzlichen Funktionalit tsparametern wie Auswahl unterst tzter Sprachen und Dateiformate ist d
7. InTerm NewTerm E IndexTerm gt RelTerm de O Z hlen entfernen klein geschriebene Worte entfernen C HTML Tags l schen O Quellen l schen O Dateien hinzuf gen Wortlange Zeichen Zeichen Zeichensatz SemTerm Stopp Wort und Sonderzeichen listen berpr fen adaptieren Abb 8 ProTerm Einlesevorgang starten Einlesevorgang starten 33 ProTerm Abb 9 ProTerm Ergebnis des Einlesevorgangs 34 ProTerm Tab 2 bersicht Einlesedauer Projekt Dauer des Dokumentations Anzahl der Seitenanzahl Einlesevorgangs gruppe Sprache n Datum Uhrzeit Dokumente pdf Format in Minuten EMCON de 03 08 09 13 35 4 448 05 57 EMCON en 03 08 09 13 45 4 448 07 24 EMCON de en 03 08 09 13 47 8 896 04 08 SANTORIN de 25 08 09 20 50 3 390 00 59 SANTORIN en 25 08 09 20 51 3 384 00 46 SANTORIN de en 25 08 09 20 52 6 774 01 24 INDIZIERTECHNIK de 27 08 09 01 09 1 212 00 34 INDIZIERTECHNIK en 27 08 09 01 12 1 208 00 32 INDIZIERTECHNIK de en 27 08 09 01 13 2 420 01 01 7 2 5 NewTerm Terminologieextraktion Nach den vorbereitenden Schritten erfolgt die TE Die Projekte und Filter wurden angelegt und eingelesen Durch Klicken auf das Icon NewTerm am linken Bild schirmrand kann das zu bearbeitende Projekt und der dazugeh rige F
8. ProTerm ProTerm Datei ProTerm Administration Info Role rm Filter AVL_INDIZIERTECHNIK_de y SS Einlesedatum 2009 08 27 23 48 AT2645D_04_IndiPar_Mess C Differenz NewTerm Messung new m Voreinstellungen new Signale new Definition Daten Software Zylinder Abb 18 ProTerm NewTerm Gefiltert nach H ufigkeit der Dokumente in mehr als sechs eingelesenen Dokumenten 43 ProTerm d Max In diesem Feld kann nach der absoluten H ufigkeit der Benennungen in den einge lesenen Dokumenten gefiltert werden Durch Klicken auf den Spaltenkopf Max k n nen die Ergebnisse in aufsteigender oder absteigender Reihenfolge angezeigt wer den siehe Abb 19 Mithilfe der Verh ltniszahlen Gr er als gt und Kleiner als lt ist es m glich das Ergebnis zu verfeinern siehe Abb 20 ProTerm EIER Datei ProTerm Administration Info PROTerm pemen 2 Einlesedatum 20090621 1136 EMCON m Inf emm E NewTerm Seite von Anzahl 6124 Abb 19 ProTerm NewTerm Max Gefiltert nach H ufigkeit absteigend 44 ProTerm ProTerm Datei ProTerm Administration Info PROTerm sl 2009 08 21 11 36 EMCON ICY Ale anzeigen y I Bee Status Do Zen Len Nomiet NewTerm Steigung Modellen durchf hren physikalische Demand Addition Liegen Installation erm glichen Schwerpunkt Verteilu
9. Terminologieextraktion 4 2 Was ist Terminologieextraktion Zerfa 2006 stellt fest dass Extraktion von Terminologie eine sehr subjektive Angelegenheit ist Terminologieextraktion kann als Prozess zur Identifizierung von Termkandida ten TK in einem gegebenen Text definiert werden und ist terminologisch von Termerkennung zu unterscheiden Termerkennung bezeichnet den Prozess des Vergleichs von Termkandidatenlisten die Ausgabe von TE mit einer be stehenden Termdatenbank TDB mit dem Ziel bekannte von unbekannten Termini zu unterscheiden Zielinski und Safar 2005 Zielinski und Safar 2005 unterscheiden monolinguale und bilinguale TE Monolinguale TE wird beim bersetzungsprozess normalerweise vor Begin sic des bersetzens von Ausgangs oder Referenztexten angewendet Das Ziel ist die Erkennung der relevanten Terminologie eines zu bersetzenden Texts oder im Fall der reinen Terminologiearbeit die Erkennung der Termini eines gewissen Fachgebiets Bilinguale TE wird hingegen haupts chlich auf bersetzte Texte paralleler Korpora oder Translation Memories angewendet Das Hauptziel dabei ist die Erkennung potentieller quivalente in beiden Spra chen Thurmair 2003 In beiden F llen k nnen die gewonnenen TK mit bereits existierenden Termdatenbanken verglichen werden um bekannte Termini von unbekannten zu differenzieren vgl Saf 2004 4 3 Terminologieextraktionsverfahren Zielinski und
10. Zielgr e Spinnengrafik angezeigte Grafik Abb 15 ProTerm NewTerm Benennung Trunkierung grafik 40 ProTerm b Status Durch Klicken auf den Spaltenkopf Status kann nach den Kategorisierungen sortiert werden siehe Abb 16 Noch nicht kategorisierte Benennungen haben den Status new Als Stopp Wort qualifizierte Benennungen werden als stop und akzeptierte Be nennungen als acc angezeigt ProTerm Datei ProTerm Administration Info PROTerm e EES E Einlesedatum 2005 08 25 20 50 Santorin_de Dos Ur I ees NewTerm i ele ee ee JL Abb 16 ProTerm NewTerm Gefiltert nach Status 41 ProTerm c Doc In diesem Feld kann nach der Anzahl der Dokumente gefiltert werden Durch Klicken auf den Spaltenkopf Doc k nnen die Ergebnisse in aufsteigender oder absteigender Reihenfolge angezeigt werden siehe Abb 17 Mithilfe der Verh ltniszeichen Gr Ber als gt und Kleiner als lt ist es m glich das Ergebnis zu verfeinern siehe Abb 18 ProTerm Datei ProTerm Administration Info PROlerm Filter AVL_INDIZIERTECHNIK_de y E Einlesedatum 2009 08 27 23 48 AT2645D_04_indiPer_Mess Differenz inem ONO re a NewTerm Software Daten Definition E i Signale Voreinstellungen Zylinder Resultate Verwendung Beispielsweise AVL_INDIZIERTECHNIK Abb 17 ProTerm NewTerm Gefiltert nach H ufigkeit der Dokumente absteigend 42
11. assignede unterschi _04_IndiP Nike edlichen ar_Messp Motorgeo arameter metrien editor_3 kann man Parametri die erung pdft gleichen Paramete rfiles verwende n wenn man die Motorpar ameterin der Testumge bungh lt r AVL_INDI Indizierte notjet D D D Die AT2645D u ZIERTECH chnike assigned Paramete _04_IndiP NIKE rgruppe ar_Messp Messsteu arameter erung editor_3 enth lt Parametri allef r erung pdft den Ablauf einer Messung relevante Abb 37 Exportergebnis in Word RTF Datei Auszug 65 ProTerm 7 gt Extraktion INDIZIERTECHNIK 091124 Kompatibilit tsmodus Microsoft Excel nichtkommerziell Start Einf gen Seitenlayout Formeln Daten berpr fen Ansicht Add Ins Acrobat EC ee BB Als Tabelle formati FR L sch po LL 5 Tabelle formatieren schen an J KE a A 3 EJE 5 Zellenformatvorlagen SH Format Ge Zwischenablage Ausrichtung Formatvorlagen Zellen Bearbeiten CHNIK Indiziertechnik not yet Motorparameter Bei unterschiedlichen Motorgeometrien kann AT2645D_04_IndiP assigned man die gleichen Parameterfiles verwenden or_3 Parametrierun wenn man die Motorparameter in der Testumgebung halt AVL_INDIZIERTECHNIK Indiziertechnik not yet Messsteuerung assigned AVL_INDIZIERTECHNIK Indiziertechnik not yet Kurzform Langform KWM Winkelmarke Winkelmarke Dies
12. n chsten Versuch durchzuf hren gleitenden Berechnungsfensters angegeben aktuelle Versuch abgebrochen jeweiligen Firmenstandards anzupassen Menueintrag Extras angeschlossenen Kurbelwinkelrechners 4CA1 Klopfkennwerte schl gt IndiCom Abschnitt Gemultiplexte Signale KWM OT bestimmte Parameter einzufrieren IndiCom Offline betreiben wesentlich h heren Auffrischrate i A 7 4 2 AVL_INDIZIERTECHNIK Abb 24 ProTerm NewTerm Zeige Drei Wort Benennungen die fter als zweimal auftreten nach ihrer absoluten H ufigkeit sortiert 51 ProTerm 7 3 Hinzuf gen von Termkandidaten Hier wird erl utert wie ein Termkandidat ausgew hlt wird Dies erfolgt durch das Akzeptieren einer Benennung in NewTerm Nachdem der NewTerm Bereich aktiviert ist und ein Termkandidat identifiziert wurde zur Identifikation von TK siehe Kapitel 7 4 wird dieser markiert Durch Bet tigen der Funktionstaste F5 oder durch Klicken auf die Schaltfl che Akzeptiert wird der Termkandidat lediglich akzeptiert und ist der TermBank im Anschluss durch Klicken auf das TermBank Icon hinzuzuf gen Durch Markieren des zuk nftigen Termkandidaten und Klicken auf die Schaltfl che Term Bank wird dieser akzeptiert und direkt der TermBank hinzugef gt Es ffnet sich das SelectSentence Fenster siehe Abb 25 in dem alle Textpassagen in denen der Termkandidat vorkommt aufgelistet werden Die Darstellungsform ist auf
13. Projektes zu wechseln und die jeweiligen Einleseparameter zu berpr fen und gegebenenfalls zu adaptieren siehe Abb 8 ProTerm kann pdf txt html xml sowie alle Microsoft Office Formate einlesen Im Zuge dieser Masterarbeit wurde ausschlie lich mit pdf Formaten gearbeitet Nachdem der Einlesevorgang beendet ist erstellt ProTerm eine bersicht ber das Ergebnis des Einlesevorgangs Es werden Anzahl der ein gelesenen Dateien der gefundenen Benennungen der neuen Benennungen und der bestehenden Benennungen sowie die Laufzeit des Einlesevorgangs angezeigt siehe Abb 9 Nach R cksprache mit Experten stellte sich heraus dass ProTerm im Vergleich zu anderen TET weniger Zeit zum Einlesen von Dokumenten ben tigt 31 ProTerm Eine bersicht ber die Dauer des Einlesevorgangs und ber die bestehenden und gefundenen Benennungen ist Abb 9 und Tab 2 zu entnehmen ProTerm Te x Datei ProTerm Administration Info PRoOTerm u nTerm Neues Projekt anlegen Projektname Filter AVL_CAMEO_en AVL_CAMEO_de __t schen _Zur cksetze eller Benutzer Bech AVL_INDIZIERTECHNIK Abb 7 Filter aktivieren 32 ProTerm InTerm aktivieren Filter Verzeichnis berpr fen Einleseparameter berpr ausw hlen adaptieren fen adaptieren ProTerm 9 E x CA A AE PRoOTerm AVL CAMEO JAVL_CAMEO_en AVL de D stel
14. TK in nur einer Spra che verf gbar ist weil er beispielsweise nicht bersetzt wurde in der anderen Spra che ein leerer Eintrag anzulegen und eventuell mit einer Anmerkung zu versehen ist Das Hinzuf gen eines leeren Eintrages erfolgt durch Markieren des bestehen den Eintrages und anschlie endem Klicken auf Hinzu Das nun erscheinende Feld wird nicht beschriftet Nachdem mit OK best tigt wurde erscheint das AddNewTerm Fenster in dem die nicht vorhandene Sprache ausgew hlt wird Dieses Fenster bie tet zudem die M glichkeit zu kontrollieren ob dem korrekten Eintrag ein leerer Ein trag hinzugef gt wird Sollte dies nicht der Fall sein kann hier ein anderer Eintrag ausgew hlt werden Das Vorhandensein von Eintr gen in beiden Sprachen ist f r den Export der TK aus ProTerm notwendig siehe Kapitel 7 7 53 ProTerm ProTerm Datei ProTerm Administration Info NewTerm 2010 02 22 13 15 Masterarbeit_ bersicht v Differenz JAVL_CAMEO y Textpassage Co 50D Der Inhalt dieser Dokumentation darf ohne A 18 2 2 CAMEO Benutzeroberfl che 22 2 4 Effizientes Arbeiten mit CAMEO 23 2 5 CAMEO Dokumentenstruktur 24 2 6 CAMEO 39 Inhaltsverzeichnis 4 AVL CAMEO V3 2 1 3 2 7 Systeme 126 6 4 CAMEO spezffische Anzeigeelemente 183 Inhaltsverzeichnis 6 AVL CAMEO V3 2 1 9 2 1 Datengruppe 340 Inhaltsverzeichnis 8 AVL CAMEO V3 2 1 14 2 Protokoll speiche
15. Vorgaben ProTerm Kooperatonspariner 16 32 AVE LIST GMBH EE 16 52 1 Vorgaben EE 17 Exkurs Datenkategorien en 19 GAS SA 19 8 22 EXpIIKANON Gee ae 20 Le ek le ALON EE 20 en EE 21 Inhaltsverzeichnis EN e E1 D 23 7 1 Vorbereitende Ma nahmen n a nee 23 7 2 Prozess Terminologieextraktion mit ProTerM 24 7 2 1 Vorbereiten der Texte Ae 26 722 ProTermistalenanoneninaprenna n eae 26 7 2 3 Projekt und Filter anlegen ausw hlen nn 27 7 2 4 InTerm Einlesen der Dokumente nn 31 7 2 5 NewTerm Terminologieextraktion en 35 7 3 Hinzuf gen von Termkandidaten ccccccccnnnnccccccnnncncconnnnnanancnoncnnncnnnnnnnnnnnnns 52 7 4 identifizieren von Termkandidaten AEN 56 7 9 Le EE 57 TON SEELE Anke Nee Ne ee a N ehe 57 A o 60 E Begi eN GING aha Lae Soa sda O 60 de ee 61 7 6 4 E A 62 7 7 Export aus e RE 63 7 8 Ergebnis der Temmmologieevtrakion nennen 67 7 9 Validierung der Termkandidaten en 68 7 10 Stopp Wort Listen EE 68 7 10 1 Erstellen neuer Stopp Wort Listen unn 70 7 10 2 Verwendung der 72 7 10 3 Generieren von Stopp W rtern w hrend des Auswahlverfahrens 73 7 10 4 ndern der Stopp Wortlisten occiciononoconcnnonocenencnronnnencnnorininenos 74 7 11 Andere M
16. Wort Listen zu identifizieren sondern muss sein zielsprachliches quivalent in den Originaltexten ausfindig ma chen Die Erkenntnisse dieser Masterarbeit sollen dazu dienen die zweisprachige Terminologieextraktion mit ProTerm weiterzuentwickeln Abstract English Abstract English This Masters Thesis examines the terminology management tool Pro Term by Pro Com Strasser for its applicability to bilingual terminology extraction AVL List GmbH the world s largest privately owned and independent company for the development of powertrain systems with internal combustion engines as well as instrumentation and test systems AVL Company 2010 provided the corpus for the terminology ex traction consisting of technical documentations only The main task was to extract bilingual term candidates and adequate data for data categories definition explica tion collocation and context The terminology extraction technique applied was semi automatic and can be assigned to the hybrid approach combining manual and statistical terminology extraction techniques Considering stop lists with general lan guage and stop lists especially created for and adapted during this Thesis as well as the coordination of the statistical parameters ad libitum facilitated the term recognition within a short time Moreover ProTerm succeeds in importing various formats Micro soft Office files pdf txt html and xml and character sets ISO 8859 1 Wester
17. der Phraseologiefoschrung Bochum Brockmeyer 499 523 zitiert in Cedillo Ana Caro Fachsprachliche Kollokationen T bingen Narr 2004 Sa R Vergleichende Untersuchung von Terminologie Extraktions Tools Eine computerlinguistische Arbeit mit Englisch und Deutsch Saarbr cken Fachrichtung 4 6 Angewandte Sprachwissenschaft sowie bersetzen und Dolmetschen Univer sit t des Saarlandes Saarbr cker Studien zu Sprachdatenverarbeitung und ber setzen Band 21 2004 zitiert in Zielinski Daniel und Yamile Ramirez Safar Eine Onlineumfrage zum Einsatz von Terminologie extraktions und Terminologieverwaltungstools Sprachdatenverarbeitung Fachrichtung 4 6 Angewandte Sprachwissenschaft sowie bersetzen und Dolmetschen Universit t des Saarlandes Saarbr cken 2005 Schmitt Peter A Anleitungen Benutzerhinweis In Handbuch Translation von Mary Snell Hornby Hans G H nig Paul Ku maul und Peter A Schmitt 209 213 T bingen Stauffenburg 2003 Schmitz Klaus Dirk Datenkategorien f r die Terminologieverwaltung Auszug aus der ISO 12620 1999 Computer applications in terminology Data categories berarbeitet und lokalisiert f rs Deutsche K ln 2003 Soukup Unterweger Irmgard Ein praxisorientiertes Terminologieverwaltungsmodell f r das betriebliche Umfeld Donau Universit t Krems 2002 Thurmair G Making Term Extraction Tools Usable Comprendium Germany Letzte Uberpr fung 11 07 03 URL http www comp
18. und zu speichern sondern wollen auch zus tzliche Informationen sammeln wie z B Kontexte Definitionen oder andere semantische Informationen z B semantische Relationen Deshalb w re ein Schritt der Hersteller von TETs in die Richtung derartiger Entwicklun gen sehr willkommen ProTerm erm glicht es Datenelemente f r Datenkategorien die in den eingelese nen Texten vorhanden sind ohne gro en Zeitaufwand zu extrahieren siehe Kapitel 7 2 4 Im Vorfeld wurde mit der AVL vereinbart Datenelemente f r die Datenkatego rien Kontext Definition Explikation und Kollokation je nach Vorkommen in den Do kumentationen zu extrahieren Im Folgenden wird n her auf die extrahierten Daten elemente f r die Datenkategorien n her eingegangen 6 1 Definition Schmitz 2003 erl utert die Bedeutung von Definition wie folgt Aussage die einen Begriff beschreibt und die Abgrenzung von anderen Begriffen innerhalb eines Be griffssystems erm glicht F r Terminologielehre und Terminologiearbeit sind Definitionen ganz beson ders wichtig denn hier stehen die Begriffe im Mittelpunkt und diese m ssen mit sprachlichen Mitteln eingegrenzt bzw beschrieben werden Entsprechend lautet die Definition von Definition in DIN 2342 Begriffsbestimmung mit sprachlichen Mitteln 1992 2 Zur Funktion von Definitionen sagt DIN 2330 1993 6 folgendes Beim Definieren wird ein Begriff mit Hilfe des Bezugs auf andere Begriffe innerhalb eines Beg
19. za StW Liste NEU acc_de_AVL_MA La IR acc_de_Emissions 1 acc_de_Indiz_2 acc_en_AVL_MA acc_en_Emissions Abbrechen OK acc_en_Indiz_2 AVL_Emissions_de AVL_Emissions_en PT_phrases PT_sentences PT_terms RW_DE_STAN RW_EN_STAN Standard Deutsch Abb 41 ProTerm Erstellen neuer Stopp Wort Listen 70 ProTerm S EditStw gt AddEditStw Stopp Wort Stopp Won NEU 2 Sprache DE y Regul rer Ausdruck Abbrechen OK Abb 42 ProTerm Manuelles Hinzuf gen von Stopp W rtern ffnen iere Suchen in ES SW Listen x Bir E Bestehende Eintr ge VOR Extraktion_DE E Bestehende Eintr ge VOR Extraktion_EN Stopp Wort NEU 1 Stopp Wort NEU 2 Abb 43 ProTerm Importieren von StW Listen in txt Format 71 ProTerm 7 10 2 Verwendung der Stopp Wort Listen Die StW Listen dienen dazu nicht gew nschte Benennungen auszuschlie en Eine der Vorgaben der AVL war es Benennungen mit einem m glichst hohen Fach sprachlichkeitsgrad zu extrahieren deshalb konnten allgemeinsprachliche Termini ausgeschlossen werden Die Entwickler haben dazu StW Listen mit allgemein sprachlicher Terminologie in englischer und deutscher Sprache wie sie auch von den g ngigen Suchmaschinen verwendet werden zur Verf gung gestellt Neben diesen StW Listen wurden zu Beginn auch die bisherigen Eintr ge der AVL Terminologiedatenbank als StW Liste generiert siehe Abb 43 und eingelesen So mit k
20. 2Instanzen starten NewTerm Mithilfevon Parametereinstellungen AT Termkandidaten auswahlen StW Listen verwalten Sprachwahl Zu Eintrag hinzuf gen ZT Termkandidat akzeptieren TermBank hinzuf gen Datenkategorie n hinzuf gen ndern Projekt ausw hlen NewTerm Datenkategorie n hinzuf gen ndern ZT Termkandidat in ProTerm suchen Revision Neuen Filter anlegen InTerm In AT Originaldokument nach Termkandidate suchen H ufigkeit Kapitel beachten InZT Originaldokument nach AT Termkandidat Aquivalent en suchen H ufigkeit Kapitel ber cksichtigen Export in Excel via Access Abb 1 Prozess Terminologieextraktion mit ProTerm 25 ProTerm 7 2 1 Vorbereiten der Texte Die Texte wurden von AVL im pdf Format zur Verf gung gestellt Tabelle 1 zeigt dass AVL Texte aus vier Dokumentationsgruppen bereit gestellt hat Es wurde f r jede Dokumentationsgruppe ein Ordner auf dem Desktop erstellt Dieser Ordner enth lt Unterordner f r jede Sprache Im Falle dieser Masterarbeit waren dies Ord ner f r Deutsch de und Englisch en In diese Ordner wurden danach die entspre chenden Dokumente nach Dokumentationsgruppen abgelegt Vor dem Starten von ProTerm wurden die deutschen und englischen Texte ge ffnet um in der TE Phase das Zuordnen von ausgangssprachlichen und zielsprachlichen quivalenten zu er leichtern siehe Abb 1 7 2 2 ProTerm start
21. 36 3 0 Produkt Backward SignificanceTest new Ergebnisse des Umfang Einlesevorgangs gefundene SC Benennungen wissen solten 1 Windows Bildschirm geringf gig Einhaltung new 3 None 1 4 Abweichungen new 3 i Onlinedokumentation abweicht new EA Zur ersten Seite wechseln 5 bestimmten Zur letzten Seite wechseln Anwender beachtet Zur vorherigen Seite wechseln Gefundene gen gesamt Abb 10 ProTerm NewTerm Zur n chsten Seite wechseln 36 ProTerm Eingelesenes Dokument anzeigen zwischen den eingelesenen Dokumen ten wechseln In Originaldokument Dokumentansicht wechseln schlie en Aktuelle Benennung Datei ProTerm Administration Info PROlerm E a HES e In Dokumentansicht E suchen Strg F Von einem Dokument ins n chste wechseln Aktuelle Benennung Abb 11 ProTerm Dokumentansicht Suche in Dokumentansicht 7 2 5 1 Parameter Die Parameter dienen dazu das Einleseergebnis zu filtern In Abb 12 sind die zur Verf gung stehenden Parameter dargestellt und ihre Funktion wird im Anschluss detailliert beschrieben A I III em d AVL List GmbH new Abb 12 ProTerm NewTerm Parameter 37 ProTerm a Benennung Im Feld Benennung kann eine Benennung gesucht werden Mithilfe des Trunkie rungssymbols vor und oder nach
22. 7 79 84 98 Terminologiearbeit 5 7 10 17 19 21 83 Terminologieextraktion 5 9 10 11 16 24 25 35 67 83 84 93 98 99 Terminologieextraktionstool 5 11 93 Terminologieextraktionsverfahren 10 13 24 79 Terminus 5 11 12 13 74 77 80 Termkandidat 11 13 52 57 67 74 93 Termpaar 11 TET 5 7 11 14 31 80 93 TK 10 11 12 13 14 23 35 52 56 63 68 72 79 93 toolgest tzte Terminologieextraktion 10 Trunkierung 38 39 40 92 Zieltext 93 zweisprachige TE 6 79 96 Curriculum Vitae 11 Curriculum Vitae Angaben zur Person Verena Christina Bleich Bakk phil Am Lapp 1 Dreschnigstra e 53 1 7152 Pamhagen 9500 Villach sterreich 0043 0 4242 38 580 0043 0 650 23 23 383 verena_bleich gmx at Geburtsdatum 10 November 1983 Staatsb rgerschaft Osterreich Sprachkenntnisse Deutsch Muttersprache Franz sisch Englisch Ausgezeichnet Spanisch Russisch Basiskenntnisse Ausbildung 2007 2010 Universit t Wien Masterstudium bersetzen Deutsch Franz sisch Englisch 2008 2009 Institut Catholique de Paris ISIT Institut de Management et de Communication interculturels Erasmus Programm 2002 2007 Universit t Wien Bakkalaureatsstudium bersetzen und Dolmetschen Bakkalaurea der Philosophie 1994 2002 Bundesgymnasium und Bundesrealgymnasium Neusiedl am See Matura 97 Curriculum Vitae Fachgebiete Terminologiewissenschaft Term
23. 9 Y Pass Through 2 YW spalten l schen Tabellennamen Ansicht Ausf hren r Tabelle Anf gen Aktualisieren Kreuztabelle L schen Tabelle Summen a H i erstellen a Datendefinition anzeigen A fad Zur ckgeben Alle gt a Parameter Ergebnisse Abfragetyp Abfragesetup Einblenden Ausblenden G 5 x Sicherheitswarnung Bestimmter Inhalt in der Datenbank wurde deaktiviert Optionen Abfragen 7 AvL_TB_EXPORT_2_20091124 mans _TermBank_TermStar _TermBank_TermStar_not_doppelte_quelle ptb_pinf ptb_pi_b_ref ptb_termbank ptb_begriff amp S 1_begriffsebene we we ee mn m Mone 4 gt 1 abfrage4_fachgebiet ERA S AUSGEBLENDET Feld Y Projekt PT_PIN_BEZ Sachgebiet not yet Anmerkung_Begriff de_Benennung de_Quelle de Tabelle ptb_termbank ptb_pinf de_benennung de_benennur 8 AVL_Benennungen Sortierung E AVL det und kont ER Kriterien INDIZIERTECHNIK El AVL_TB_EXPORT_1 oder AVL_TB_EXPORT_2_20091124 de_benennung a en_benennung a normierung_alle E VOLLST NDIG Projekt Information eingeben Mi lt gt Bereit Num EEE Abb 35 Microsoft Access Export der Extraktionsergebnisse 63 ProTerm 4 ES x0 Union Za y Spalten einf gen gt gt A Eigenschaftenblatt Pass Through 2 Y spalten l schen a Tabellennamen Ansicht Ausf hren Ausw hlen Tabelle Anf gen Aktualisieren Kreuztabelle L schen Tabelle
24. ECA NN 77 7 11 1 Ein Filter mit allen Dokumenten einer Dokumentationsgruppe 77 7 11 2 pdf Dokumente kapitelweise einlesen nenn 77 Ei e DE 79 Inhaltsverzeichnis 9 Literaturverzeichnis ae ee 83 O 87 10 1 Benutzeroberfl che Pro Term 87 10 2 ProTerm Funktionstasten ooccnincnoncccconncccnnnnnnenoncnonnnnncnnnnnnnnnnnnnnnnnnnnnnnnns 92 10 3 Abk rzungsverzeiehnis EE 93 10 4 Tabelle 93 10 5 Abbildungsverzeichnis a e in 94 10 6 96 11 Curriculum Vitae caia itn dale 97 Einleitung 2 Einleitung Zu Beginn soll auf die Bedeutung von Terminologie in der heutigen Zeit hingewiesen werden Terminologie als Gesamtheit der Begriffe eines Fachgebiets ist heute von enor mer Bedeutung f r eine Reihe von wirtschaftlich interessanten Gebieten Sie ist das Skelett jeder fachwissenschaftlichen und spezialisierten Kommunikation so etwa bei wissenschaftlichen Kongressen Sie spielt eine gro e Rolle in der zunehmenden internationalen Zusammenarbeit und in der Gesetzgebung wo die quivalenzen zweier Begriffe genau geregelt sein m ssen Haller 2007 Die Verwendung einer korrekten Terminologie ist heutzutage in vielen Lebens bereichen von zunehmender Bedeutung Eine exakte und vollst ndige Termino logie steigert die Produktivit t von bersetzern und technischen Redakteuren und ist eine Vor
25. Normierung aufheben 75 ProTerm Normierung aufgehoben 76 ProTerm Benutzeroberfl che Giort 87 ProTerm Benutzeroberfl che Date 88 ProTerm Benutzeroberfl che Dro ferm 89 ProTerm Benutzeroberfl che Administration 90 ProTerm Benutzeroberfl che Info 91 95 Anhang 10 6 Index Datenkategorie 52 62 67 Definition 19 62 67 Dokumentansicht 35 37 52 79 Einleseergebnis 28 37 51 68 72 79 einlesen 31 77 Einwortbenennung 35 Evaluierung 14 80 83 Explikation 19 20 62 67 Export 14 24 53 57 60 63 64 extrahieren 17 19 38 56 72 79 Import 14 63 69 Kollokation 19 20 62 67 Kontext 19 21 52 62 67 linguistisches Extraktionsverfahren 10 13 manuelle Terminologieextraktion 10 11 Mehrwortbenennung 35 Noise 14 80 Originaltext 11 79 Originaltextansicht 35 79 Parameter 37 51 57 79 Precision 14 80 ProTerm 5 7 14 15 16 19 23 24 25 26 27 28 29 30 31 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 49 50 51 53 54 55 56 57 58 59 60 61 62 63 67 69 70 71 75 76 77 79 87 88 89 90 91 92 99 Recall 14 80 Silence 14 80 statistisches Extraktionsverfahren 12 StW Liste 70 72 74 Suchfunktion 35 52 TE 5 7 10 11 13 21 23 24 26 35 56 57 79 87 93 Terminologie 5 7 9 10 15 16 23 24 38 56 72 7
26. S tze vor eingestellt d h es werden ganze S tze angezeigt Es besteht die M glichkeit in die Phrasenansicht in der nur Textteile angezeigt werden zu wechseln siehe Abb 26 Der ausgew hlte Termkandidat wird im Feld Token angezeigt Mithilfe des Feldes Suchen wird die Suche innerhalb der Textpassagen in denen der TK vorkommt be schleunigt Durch Ausw hlen von S tzen oder Phrasen kann die Darstellungsform der Textpassagen ge ndert werden Im SelectSentence Fenster kann eine Datenka tegorie hinzugef gt werden Die Datenkategorie Kontext ist vorausgew hlt da sie am h ufigsten zur Anwendung kam Es besteht die M glichkeit durch Klicken auf eine andere Datenkategorie diese auszuw hlen In der TermBank k nnen weitere Datenkategorien erg nzt werden Es ist notwendig eine Datenkategorie auszuw h len auch wenn diese im Anschluss wieder gel scht wird da nur so die Quelle des Termkandidaten bernommen werden kann Durch Klicken auf eine der Textpassa gen siehe Abb 25 und Abb 26 wird diese vollst ndig im unteren Feld angezeigt Durch Doppelklicken auf eine Textpassage oder Klicken auf das Icon Text kann in das eingelesene Dokument also in die Dokumentansicht und anschlie end in das Originaldokument gewechselt werden Im eingelesenen Dokument kann mittels der Suchfunktion Strg F nach einer beliebigen Benennung gesucht werden Die in New Term ausgew hlte Benennung ist farblich hervorgehoben vgl Abb 11 Wird aller dings ke
27. Safar 2005 sowie Witschel 2005 klassifizieren die Ans tze zur TE als linguistisch statistisch oder hybrid Zerfa 2006 unterscheidet vier Extraktions verfahren manuelle Extraktion Konkordanzprogramme Statistische und Linguisti sche Extraktionsverfahren M gge 2007 unterteilt die Verfahren in Manuelle Termi nologieextraktion Anwendungen mit Indexwerkzeugen oder Komplexen Konkor danzwerkzeugen Eckstein 2009 gliedert die Methoden der toolgest tzten Termino logieextraktion in automatische halbautomatische und manuelle TE Im Folgenden werden die einzelnen Extraktionsverfahren im Detail vorgestellt 4 3 1 Manuelle Extraktion Bei der manuellen Extraktion wird der Text vom bersetzer oder Terminolo gen gelesen und verstanden und dieser kann aufgrund seines Vorwissens im Terminologieextraktion Fachgebiet oder der Zielsetzung f r die Extraktion entscheiden welcher Terminus oder welches Termpaar in die Liste aufgenommen wird Zerfa 2006 M gge 2007 f gt hinzu dass w hrend der Lekt re Terminologiekandidaten ggf mithilfe geeigneter Makros in eine Extraktionsliste eingetragen werden Er merkt ferner an dass dlieses Verfahren die einzige allgemein bekannte Methode zur Terminolo gieextraktion ist die sich jedoch ungeachtet ihres geringen Komplexit tsgra des keiner gro en Beliebtheit erfreut da die manuelle Extraktion insbesonde re bei gro en bersetzungsprojekten ausgesprochen per
28. _CAMEO_de y Einlesedatum 2010 02 22 13 15 Masterarbet_Ubersicht y 1 Differenz SelectSentence InTerm TermBank JAVL_CAMEO Textpassage CAMEO Be New em yond the Basics User s GuideBasics AVL CAMEO V3 2 1 Februar 2009 AT3050D Der Inhalt dieser Dokumentation darf ohne PN 11 2CAMEO Erste Schritte 3 13 2 1 CAMEO starten und beenden 18 2 2 CAMEO Benutzeroberfl che 22 2 4 Effizientes Arbeiten mit CAMEO 23 2 5 CAMEO Dokumentenstruktur 39 Inhaltsverzeichnis 4 AVL CAMEO V3 2 1 3 2 7 Systeme 126 6 4 CAMEO spezfische Anzeigeelemente 183 Inhaltsverzeichnis 6 AVL CAMEO V3 2 1 9 2 9 1340 Inhaltsverzeichnis 8 AVL CAMEO V3 2 1 14 2 Protokoll speichem Was Sie wissen schen 10 AVL CAMEO V3 2 1 1 5 ber diese Dokumentation Basis f r diese Dokumentation ist das Inhalt amp Umfang Der CAMEO V3 2 1 User s Guide Bascis beschreibt Standardfunktionen und Verfahren die Sie f r Ihre Arbeit mit CAMEO ben tigen Um Ihnen das Vorgehen beim Erlemen und Verwenden von CAMEO zu erfeichtem ist dieser User s Guide entsprechend dem CAMEO Workflow aufgebaut Was Sie wissen sollten 12 AVL CAMEO V3 2 1 13 User s GuideBasics CAMEO Erste Schritte 2 CAMEO Erste Schritte Was ist de um mit CAMEO zu arbeiten Dieser Abschnitt f hrt Sie in die ersten Schritte CAMEO ein 2 1 CAMEO starten und beenden W hrend des Installation
29. ahiert vor und oder nach deren Auftreten sich im Text ein Stopp Wort und oder ein Sonderzeichen befindet Eine exakte Aufstellung der Noi se Silence beziehungsweise Recall Precision Parameter war aus diesem Grund nicht m glich Die Entwickler von ProTerm haben bereits w hrend des praktischen Teils dieser Masterarbeit daf r gesorgt dass mehr Datenkategorien zur Auswahl verf gbar gemacht wurden die Quellen automatisch extrahiert wurden die Trun kierungsfunktion auch beim Zuordnen der TK zu den bereits vorhandenen Eintr gen in der TermBank siehe Kapitel 7 3 und beim Suchen nach Eintr gen in der Term Bank selbst siehe Kapitel 7 6 genutzt werden kann leere Datenkategorien in der TermBank siehe Kapitel 7 3 farblich hinterlegt sind und dass ProTerm in der Lage ist mehr Zeichens tze einzulesen Um ProTerm noch benutzerfreundlicher zu gestal ten soll zudem ein Auswahlelement eingerichtet werden das dem Terminologen im NewTerm Bereich erm glicht zwischen Automatischer Trunkierung und der Su che nach der eingegebenen Schriftzeichen zu wechseln Der Export aus ProTerm soll ebenfalls umgestaltet werden sodass es in Zukunft m glich sein wird in die Formate MATIF und oder TBX die von vielen Terminologie verwaltungssystemen unterst tzt werden zu exportieren F r die Arbeit mit der TermBank w re es von Vorteil nachvollziehbar zu machen welcher User wann welchen Eintrag erstellt be ziehungsweise bearbeitet hat 10 Vor Begin
30. altung E Caption Editor E Kategorie Editor Stopp Wort Editor Stopp Wort Kommission Not Wort Editor Not Wort Kommission Sonderzeicheneditor Idiom Editor TermBank Manager InTerm InTerm NewTerm Abb 52 ProTerm Benutzeroberflache Administration 90 Anhang ProTerm EEE PROlerm InTerm Version 0 91 6 NewTerm Versionsdatum 27 02 2006 Treiber mysql Datenbank proterm_utf8 Lizenzende 30 06 2010 Anzahl der eingelesenen Dokumente 2442 Anzahl der gefundenen Benennungen 258299 Lizenzschl Programm sen AVL_SANTORIN Abb 53 ProTerm Benutzeroberflache Info 91 Anhang 10 2 ProTerm Funktionstasten Die nachstehende Tabelle gibt einen berblick ber die Funktionen der Funktions tasten in ProTerm Tab 5 ProTerm Funktionstasten Funktionstaste Funktion Anmerkung F2 Benennung bearbeiten Automatische Trunkierung einer zuvor markierten Benennung Beispiel F4 Thesaurus FS Akzeptiert F6 Stopp Wort hinzuf gen F7 Not Wort hinzuf gen F10 Men leiste 92 Anhang 10 3 Abk rzungsverzeichnis Die nachstehende Tabelle gibt einen berblick ber die in dieser Masterarbeit ver wendeten Abk rzungen und ihre Langformen Tab 6 Abk rzungsverzeichnis Kurzform Langform Anmerkung AVL AVL LIST GmbH TE Terminologieextraktion TET Terminologieextraktionstool TEP Termin
31. andenen bersetzun gen durchsucht Ihr gro er Erfahrungsschatz im Umgang mit AVL Dokumentationen tr gt dazu bei in kurzer Zeit bislang neue Fachtermini zu erkennen 7 2 Prozess Terminologieextraktion mit ProTerm In dieser Masterarbeit werden die f r die TE relevanten Arbeitsschritte in ProTerm detailliert beschrieben siehe Abb 1 Es soll gezeigt werden wie mit ProTerm Ter minologie und dazugeh rige Datenelemente f r die Datenkategorien extrahiert wer den k nnen Das Terminologieextraktionsverfahren mit ProTerm kann in drei Phasen unterteilt werden 1 Vorbereiten der Texte 2 Arbeit in ProTerm und Zuordnen der zielsprachlichen Aquivalente 3 Export aus ProTerm Zu Beginn werden die Texte vorbereitet siehe Kapitel 7 2 1 AnschlieBend erfolgt die Arbeit mit ProTerm und somit die Phase der TE siehe Kapitel 7 2 2 bis Kapitel 7 5 Den Abschluss der TE bildet der Export aus ProTerm siehe Kapitel 7 7 Das Extraktionsverfahren das bei ProTerm zur Anwendung kommt wird den hybriden Extraktionsverfahren zugeordnet Es ist eine Kombination der manuellen Extraktion siehe Kapitel 4 3 1 und des statistischen Extraktionsverfahrens siehe Kapitel 4 3 4 24 ProTerm Vorbereiten der Dokumente Originaldokumente ffnen NewTerm AT Termkandidat akzeptieren TermBank hinzuf gen TermBank Projektinformation angeben TermBank Y Sprachwahl Zu Eintrag hinzufiigen ProTerm
32. annten themodynamischen Verustwinkel geringerer a AVL_INDIZIERTECHNIK Abb 13 ProTerm NewTerm Benennung Trunkierung winkel 7 Steht eine gesuchte Benennung nicht vor oder nach einem Stopp Wort beziehungsweise Sonder zeichen wird sie hier nicht als Einzelwort angezeigt 38 ProTerm ProTerm Datei ProTerm Administration Info P r m Filter AVL_INDIZIERTECHNIK_de Einlesedatum 2009 08 27 23 48 AT2645D_04_IndiPar_Mess Differenz Nic InTerm Findizierter m Abschnitt Indizierter Mitt 12 2 Indizierter Mitteldruck Abschnitt Indizierter Mitteldruck semn Ii AVL_INDIZIERTECHNIK Abb 14 ProTerm NewTerm Benennung Trunkierung indizierter _ 39 ProTerm ProTerm Datei ProTerm Administrati PROTerm MS AV_CAMEO_de 4 Einlesedatum 2010 02 22 13 15 Masterarbett_Ubersicht sl Differenz 8 OOOO Pess gt 3D Modellgrafik new 1 2 15 2 0 Mehrkanal XT Grafik Chart Grafik 9 4 6 Modellgrafik Rohdaten XT Grafik IndexTerm 9 4 7 Nomalverteilungsgrafik 9 4 8 3D Modellgrafik Betriebspunktgrafik i Wiederholpunktegrafik RelTerm 9 4 9 Konturgrafik 9 4 4 Interaktionsgrafik 13 3 2 Streugrafik 9 4 2 Intersektionsgrafik DynTerm 10 4 4 Intersektionsgrafik Eo 10 4 1 Optimierungsgrafik OnlineTerm 9 4 1 XT Grafik 10 4 8 Wiederholpunktegrafik Variationsgrafik 10 4 2 Verfikationsgrafik 10 4 7 Zielgr e Spinnengrafik
33. art sub Genus Numerus sing Workflow Publiziert Abb 34 ProTerm TermBank Termebene 62 ProTerm 7 7 Export aus ProTerm Der Export der Extraktionsergebnisse aus ProTerm erfolgte ber eine eigens von Amtsdirektor Pilles erstellte Access Abfrage in eine Excel Tabelle Bei Projektstart wurde von AVL eine Muster Excel Tabelle zur Verf gung gestellt die als Vorlage f r den Export via Access dienen sollte Diese Excel Tabelle war nach AVL Vorgabe f r den Import der TK in die AVL Termdatenbank generiert Um die in ProTerm angeleg ten Projekte nun wieder den Dokumentationsgruppen zuzuordnen wurde in Access die Projekt Information angegeben siehe Abb 35 und Abb 36 Auf Wunsch von AVL wurde hier auch das Feld Sachgebiet mit not yet assigned vorbelegt Der Ex port erfolgte in eine Word RTF Datei siehe Abb 37 Die Exportergebnisse wurden in dieser Datei gesamt markiert kopiert und anschlie end in eine leere Excel Tabelle eingef gt Diese Excel Tabelle wurde zum Abschluss benutzerfreundlich formatiert und an AVL bergeben siehe Abb 38 Os Abfragetools Microsoft Access nichtkommerzielle Verwendung X Gay Start Erstellen Externe Daten Datenbanktools Acrobat Entwurf FS 9 SU en A A CD Union Ja y Spalten einf gen Eigenschaftenblatt
34. as betriebliche Umfeld Donau Universit t Krems 2002 Eckstein Karina Toolgest tzte Terminologieextraktion In Terminologiemanagement von Felix Mayer und Ute Seewald Heeg 108 120 Berlin Bundesverband der Dolmetscher und bersetzer e V BD 2009 Haller Johann AUTOTERM Automatische Terminologieextraktion Spanisch Deutsch In Multiperspektivische Fragestellungen der Translation in der Romania von Alberto Gil Ursula Wienen und Erich Steiner 229 242 Frankfurt am Main Peter Lang 2007 Kadric Mira Klaus Kaindl und Michele Kaiser Cooke Translatorische Methodik Wien Facultas 2005 Lieske Christian Pragmatische Evaluierung von Werkzeugen f r die Term Extraktion DTT Symposium eTerminology K ln 2002 M gge Uwe Automatische Terminologieextraktion In Translationsqualit t von Peter A Schmitt und Heike E J ngst Frankfurt am Main Wien u a Lang 2007 Pearson J Terms in context Amsterdam John Benjamins Publishing Compa ny 1998 zitiert in Zielinski Daniel und Yamile Ramirez Safar Eine Onlineumfrage zum Einsatz von Terminologieextraktions und Terminologieverwaltungstools Sprachdatenverarbeitung Fachrichtung 4 6 Angewandte Sprachwissenschaft sowie bersetzen und Dolmetschen Universit t des Saarlandes Saarbr cken 2005 83 Literaturverzeichnis Rothkegel Annely Kollokationsbildung und Textbildung Hildesheim u a Olms 2009 In Sandig Barbara Hg EUROPHRAS 92 Tendenzen
35. ationspartner schriften und sonstigen Druckwerken laufend relevante Fachinformationen auszuwerten zu dokumentieren und den internen Bedarfstr gern zur Verf gung zu stellen sterreichs Bundesheer 2010 5 1 3 Vorgaben ProTerm Kooperationspartner Die wichtigsten Vorgaben der ProTerm Kooperationspartner f r diese Masterarbeit bestanden darin ProTerm f r die zweisprachige Terminologieextraktion zu testen und Anregungen zu liefern wie mit ProTerm effizient zweisprachig Terminologie ext rahiert werden kann Ein weiterer Beweggrund f r die Bereitstellung von ProTerm war es etwaige Schwachstellen des Terminologieverwaltungswerkzeuges zu eruie ren und zu dokumentieren 5 2 AVL LIST GmbH Die Firma AVL LIST GmbH gilt als Paradebeispiel f r ein international t tiges ex portorientiertes Unternehmen der sterreichischen Industrie Die Homepage von AVL gibt unter der Adresse www avl com ber Geschichte und Unternehmensberei che umfassend Auskunft Soukup Unterweger 2002 AVL ist das weltweit gr te private und unabh ngige Unternehmen f r die Entwicklung von Antriebssystemen mit Verbrennungsmotoren und Mess und Pr ftechnik AVL ist in folgenden Unternehmensbereichen t tig Entwicklung von Antriebssystemen AVL entwickelt und verbessert alle Arten von An triebssystemen als kompetenter Partner der Motoren und Fahrzeugindustrie Simulation Die f r die Entwicklungsarbeiten notwendigen Simulationsmetho de
36. aussetzung f r erfolgreiche Kommunikation Insbesondere Ar beitsfelder wie technische Dokumentation bersetzung und Softwarelokalisie rung erfordern eine systematische Terminologiearbeit Daher wird die Terminolo gieverwaltung zu einer immer wichtigeren Aktivit t bei der Vorbereitung Bearbei tung und Dokumentation eines Fachwortschatzes Zielinski und Safar 2005 Um Terminologie rascher verf gbar zu machen und effizient nutzen zu k nnen f gt Lieske 2002 hinzu dass Industrieunternehmen mit gro em Bedarf an Termi nologie sich daher f r Werkzeuge und Dienstleistungen f r die Term Extraktion inte ressieren Im ersten Teil dieser Masterarbeit werden ihre Ziele und die Herangehensweise an die Aufgabenstellung erl utert Im Anschluss werden wissenschaftliche Ans tze zur Terminologieextraktion TE vorgestellt wobei zun chst darauf geachtet wurde dass diese f r die Arbeit mit dem Terminologieextraktionstool TET ProTerm von Relevanz sind um das Kapitel zu vervollst ndigen werden danach auch andere An s tze kurz vorgestellt 1 Wie im vorliegenden Fall die AVL LIST GmbH siehe 5 2 1 2 Insbesondere im Englischen existieren viele Synonyme f r das Konzept der Term Extraktion 2 terminology extraction terminology mining automatic terminology detection oder terminology identifi cation Lieske 2002 Witschel 2005 w hlt die Schreibweise Terminologie Extraktion Nach Lieske 2002 Zielin
37. d center AYL_INDIZIERTECHNIK Indiziertechnik not yet Kurzform Langform UT unterer Totpunkt unterer Totpunkt assigned BDC bottom dead center AYL_INDIZIERTECHNIK Indiziertechnik not yet Kurzform Langform UT unterer Totpunkt assigned BDC bottom dead center unterer Totpunkt Abb 38 Exportergebnis in Microsoft Excel Auszug 66 ProTerm 7 8 Ergebnis der Terminologieextraktion Tab 4 gibt einen berblick ber das gesamte Extraktionsergebnis Jede Datenkate gorie wurde nur einmal angef hrt Die Tatsache dass die Anzahl der Datenkatego rien nicht fortlaufend identisch sind ist darauf zur ckzuf hren dass sie ausschlie lich aus ProTerm und bei Bedarf auch mehrfach dies trifft vor allem auf Kontext zu extrahiert wurden Tab 4 Ergebnis Terminologieextraktion Dokumentations Indizier gruppe CAMEO EMCON technik SANTORIN GESAMT d e 227 453 108 189 977 Termkandidat e n 228 454 108 186 976 Definition 24 5 4 9 42 Explikation d 18 17 25 22 82 Kollokation e 44 33 10 11 124 Kontext 143 141 103 38 425 Definition 22 6 4 9 41 Explikation e 17 20 20 21 78 Kollokation n 42 37 7 11 119 Kontext 139 147 111 35 432 67 ProTerm 7 9 Validierung der Termkandidaten Die Extraktionsergebnisse wurden an Herrn Baumgartner AVL gesendet und von ihm an die f r die jeweilige Dokumentationsgruppe vera
38. der Benennung werden Benennungen gefun den die aufgrund von ihrer Position im Text nicht als Einzelwort aufgelistet werden siehe Abb 13 Das Auffinden von Mehrwort Kombinationen erfolgt durch das ge meinsame Verwenden des Trunkierungssymbols vor und oder nach der Benen nung der Leertaste und einem der beteiligten Termini siehe Abb 14 Durch Kli cken auf das Icon Benennung werden die gefundenen Tokens alphabetisch initialalphabetisch oder finalalphabetisch sortiert Die Trunkierungsfunktion kann dazu genutzt werden einheitliche Terminologie zu extrahieren siehe Abb 15 ProTerm Datei ProTerm Administration Info PR ole rm Filter AVL_INDIZIERTECHNIK_de y Einlesedatum 2009 08 27 23 48 AT2645D_04_IndiPar_Mess y Differenz kurbelwinkelbasieten new NewTerm Kurbelwinkelgebers new Z ndwinkels relevanten Kurbelwinkelbereich new feiner Kurbelwinkelaufl sung erfasst new zweiter Winkelwert new 3 Kurbelwinkeln Kurbelwinkelfenster erster Winkelwert Winkelmarken n tig Kurbelwinkelmarken Benennung bearbeiten Abschnitt Winkelmarken winkelbasierenden Signale urspr ngliche Winkelparametrierung wiederherstellen Winkelmarken Arbeitsspiel Winkelmarken abgetastet Kurbelwinkelrechners Winkeldifferenz kurbelwinkelabhangige 3 3 1 1 Winkelmarken Winkelaufnehmers emitteln verf gbaren Winkelmarken ersten Winkelmarke beginnt drei Kurbelwinkelmarken verloren 7 a sogen
39. e Aufgabenstel lung bestand darin englische und deutsche Termpaare und ad quate Datenelemen te f r die Datenkategorien Definition Explikation Kollokation Kontext aus dem Do kumentationsmaterial zu extrahieren Das Terminologieextraktionsverfahren kann als toolgest tzt bezeichnet und dem hybriden Extraktionsverfahren zugeordnet werden Es wurden das statistische und das manuelle Extraktionsverfahren kombiniert Das Ber cksichtigen von Stopp Wort Listen der Allgemeinsprache und von Stopp Wort Listen die eigens f r diese Arbeit erstellt und bearbeitet wurden sowie das Koordi nieren der individuell kombinierbaren statistischen Parameter trugen dazu bei Term kandidaten rasch zu identifizieren ProTerm bietet die M glichkeit eine breite Palette an Formaten und unterschiedlichen Zeichens tzen einzulesen es kann einen gro en Umfang an Dokumenten in kurzer Zeit einlesen und erm glicht es dem Terminolo gen w hrend jeder Phase des Extraktionsprozesses in die Originaltextansicht zu wechseln Jeder Termkandidat und jede Datenkategorie die der TermBank hinzuge f gt werden werden automatisch mit der dazugeh rigen Quelle extrahiert Mithilfe der Trunkierungsfunktion kann einheitlich Terminologie extrahiert werden Das Auf finden der zielsprachlichen quivalente obliegt allerdings der Kompetenz des Termi nologen Er ist nicht nur daf r verantwortlich einen Termkandidaten mithilfe der Pa rametereinstellungen und der Verwaltung der Stopp
40. e Parametergruppe OT enth lt AT2645D_04_IndiP assigned crank angle mark Einstellungen bez glich der verwendeten ot 2 Parametrierun Winkelmarken sowie den Winkelversatz zwischen dem Triggersignal und dem oberen Totpunkt des Referenzzylinders AVL_INDIZIERTECHNIK Indiziertechnik not yet Kurzform Langform KWI Winkelmarke Winkelmarke Diese Parametergruppe KWM enth lt AT2645D_04_IndiP assigned CDM crank angle mark Einstellungen bez glich der verwendeten or_3 Parametrierun Winkelmarken KW sowie den Winkelversatz zwischen dem Triggersignal und dem oberen Totpunkt des Referenzzylinders AYL_INDIZIERTECHNIK Indiziertechnik not yet Kurzform Langform OT Oberer Totpunkt OT assigned TPC top dead center AVL_INDIZIERTECHNIK Indiziertechnik not yet Kurzform Langform OT Oberer Totpunkt oberer Totpunkt Der Wert entspricht dem Winkelversatz assigned TPC top dead center zwischen dem Trigger des winkelaufnehmers und dem oberen Totpunkt des AYL_INDIZIERTECHNIK Indiziertechnik not yet Kurzform Langform OT Oberer Totpunkt oberer Totpunkt Der Wert entspricht dem Winkelversatz assigned TPC top dead center zwischen dem Trigger des winkelaufnehmers und dem oberen Totpunkt des AVL_INDIZIERTECHNIK Indiziertechnik not yet Kurzform Langform Oberer Totpunkt assigned TPC top dead center AYL_INDIZIERTECHNIK Indiziertechnik not yet Kurzform Langform UT unterer Totpunkt UT assigned BDC bottom dea
41. einen Kolleginnen Maria Kerschbaumer Bakk phil Michaela K nig MA und Ka tharina Spiegl MA danke ich f r ihre freundschaftliche Unterst tzung und das ge wissenhafte Lektorieren Von ganzem Herzen Danke f r die liebevolle und geduldige Begleitung meiner Fami lie in erster Linie meinen Eltern Maria amp Gerhard Bleich Sie haben mir das Studium an der Universit t Wien erm glicht und meine Pl ne stets voller Zuversicht unter st tzt Von ganzem Herzen Danke meinem Freund Markus Landmann DI Seine motivierenden Worte erf llen mich immerzu mit Heiterkeit und Kraft Drum seid nur brav und zeigt euch musterhaft La t Phantasie mit allen ihren Ch ren Vernunft Verstand Empfindung Leidenschaft Doch merkt euch wohl nicht ohne Narrheit h ren 1 Goethe Johann Wolfgang Faust Der Trag die erster Teil Wien Humboldt Verlag 1946 Diese Masterarbeit richtet sich gleicherma en an Frauen und M nner Teilweise wurde nicht gendergerecht formuliert um leichtere Lesbarkeit zu gew hrleisten Kurzfassung Deutsch Kurzfassung Deutsch Im Rahmen dieser Masterarbeit wurde die Anwendbarkeit des Terminologie extraktionswerkzeuges ProTerm der Firma ProCom Strasser f r die zweisprachige Terminologieextraktion untersucht Der f r die Terminologieextraktion notwendige Korpus wurde von der AVL LIST GmbH zur Verf gung gestellt Dabei handelte es sich ausschlie lich um Fachtexte der technischen Dokumentation Di
42. en Beim Start von ProTerm wird der Nutzer aufgefordert sich anzumelden siehe Abb 2 Es besteht die M glichkeit beliebig viele Instanzen von ProTerm zu ffnen Im Zuge dieser Masterarbeit wurde mit drei Instanzen eine f r die deutschen eine f r die englischen Texte und eine f r beide Sprachen gearbeitet siehe Kapitel 7 2 5 26 ProTerm E Datei Info PrOTerm Aktueller Benutzer Es ist niemand eingeloggt Aktuelles Projekt Abb 2 ProTerm Log in 7 2 3 Projekt und Filter anlegen ausw hlen Nach dem ersten Einloggen in ProTerm wird ein Projekt angelegt indem ein Pro jektname eingetragen wird siehe Abb 3 Ein Projekt legt fest WAS eingelesen werden soll also das Thema Ein Filter legt fest WIE eingelesen werden soll also wie auf Daten durch Einstellen von Parametern zugegriffen werden soll Innerhalb eines Projekts k nnen mehrere Filter festgelegt werden 27 ProTerm Projektname eingeben Neuen Filter anlege Aktueller Benutzer Ee ist niemand eingeloggt Aktuelles Projekt Abb 3 ProTerm Neues Projekt anlegen Nachdem ein neues Projekt angelegt ist wird ein Filter erstellt In diesem Filter wird festgelegt wo sich die einzulesenden Dokumente befinden welche Formate sie ha ben siehe Kapitel 7 2 1 und welche StW Listen beim Einlesen ber cksichtigt wer den sollen StW Listen dienen dazu festzulegen welche Termini w hrend dem Einl
43. en el en ee AVL_INDIZIERTECHNIK Abb 44 Generieren von Stopp Wortern wahrend des Auswahlverfahrens 73 ProTerm ProTerm Datei ProTerm Administration Info P role rm Filter JAVL_INDIZIERTECHNIK de y Einlesedatum 2009 08 27 23 48 AT2645D_04_IndiPar_Mese y DI Differenz AA DOOR NewTerm Sg Stufen Verzeichnis Kanalnamen Protokoll selektieren Mal linear interpoliert ausgenommen sn Eis BI sam AVL_INDIZIERTECHNIK Abb 45 Generieren von Stopp W rtern w hrend des Auswahlverfahrens II 7 10 4 Andern der Stopp Wortlisten Mitunter kann es vorkommen dass ein als Stopp Wort klassifizierter Terminus in einem Nachfolgeprojekt als Termkandidat gew nscht wird Wird in der Alle Anzei gen Ansicht siehe Kapitel 7 2 5 1 h gearbeitet so ist schnell ersichtlich welche als Stopp Wort klassifizierte Benennung als solche nicht mehr gew nscht ist Nachdem das betreffende Stopp Wort markiert wurde bet tigt man die Funktionstaste F2 oder klickt auf Benennung aufheben re klassifiziert die Benennung als Neu siehe Abb 46 bis Abb 48 und l scht sie im Anschluss aus der jeweiligen StW Liste damit es nicht erneut als Stopp Wort eingelesen wird 74 ProTerm ProTerm Datei ProTerm Administration Info role rm Filter JAVL_INDIZIERTECHNIK de y Einlesedatum 2009 08 27 23 48 AT2645D_04_IndiPar_Mess DI Differenz om Cl III Jen d E NewTerm Met
44. en die Vor und Nachteile der TE mit ProTerm zu sammengefasst werden ProTerm ist einwandfrei f r die einsprachige TE anwend bar Das angewendete Terminologieextraktionsverfahren f r die zweisprachige TE kann den hybriden Extraktionsverfahren zugeordnet werden siehe Kapitel 4 3 6 Das Einleseergebnis weist alle in den eingelesenen Dokumenten vorhandenen Be nennungen aus Mithilfe der individuell kombinierbaren Parameter siehe Kapitel 7 2 5 1 kann sich der Terminologe rasch einen berblick ber h ufig vorkommende Benennungen und potentielle TK machen ProTerm bietet die M glichkeit eine brei te Palette an Formaten und unterschiedlichen Zeichens tzen siehe Kapitel 7 einzu lesen und kann einen gro en Umfang an Dokumenten innerhalb eines Einlesevor gangs bearbeiten siehe Tab 2 ProTerm ist in der Lage Mehrwortbenennungen darzustellen die vor allem in der fachsprachlichen Kommunikation h ufig verwendet werden Die Trunkierungsfunktion w hrend der TE Phase kann einerseits dazu ge nutzt werden flektierte W rter zu identifizieren und andererseits einheitliche Termino logie zu extrahieren siehe Kapitel 7 2 5 1 Die Trunkierungsfunktion ist nicht nur w hrend des TE Prozesses hilfreich sondern auch beim Zuordnen der TK zu den bereits bestehenden Eintr gen siehe Kapitel 7 3 sowie beim Suchen von Eintr gen in der TermBank siehe Kapitel 7 6 1 In der TermBank k nnen die Eintr ge manuell nachbearbeitet werden sollten sie nicht in
45. esen ausgeschlossen werden und somit im Einleseergebnis nicht auf scheinen Von den Entwicklern wurden StW Listen mit allgemeinsprachlichen deut schen und englischen Termini zur Verf gung gestellt Diese werden auch von den g ngigen Internet Suchmaschinen verwendet Vor dem ersten Einlesen wurden StW Listen erstellt die die bereits existierenden Eintr ge in der AVL Terminologiedatenbank beinhalten um zu gew hrleisten dass diese Eintr ge nicht erneut angezeigt werden Beim Erstellen des Filters werden au erdem das einzule sende Format der Zeichensatz und eine Liste der Sonderzeichen festgelegt Es be steht auch die M glichkeit beim Erstellen des Filters festzulegen dass Zahlen kleingeschriebene W rter oder HTML Tags w hrend des Einlesevorgangs entfernt werden sowie die minimale beziehungsweise maximale L nge der Zeichen vorzu geben siehe Abb 4 28 ProTerm ProTerm Speicherort der einzulesenden Einstellungen zum Zeichensatz Sonderzeichenliste Dokumente angeben Entfernen ausw hlen ausw hlen ausw hlen Aktueller Benutzer Es ist niemand eingeloggt Aktuelles Projekt Abb 4 ProTerm Neuen Filter anlegen F r jede AVL Dokumentationsgruppe wurde in ProTerm ein Projekt angelegt dem jeweils drei Filter zugeteilt wurden ein Filter f r die deutschen Texte ein Filter f r die Texte in englischer Sprache und ein dfritte
46. exten vorkommen und vergleicht die H ufigkeiten von W rtern und Phrasen in ei nem Fachtext mit den H ufigkeiten dieser Einheiten in einem allgemein sprachlichen Text M gge bedient sich bei statistischen Extraktionsverfahren der Indexwerkzeuge Da bei werden Listen s mtlicher in einem Text verwendeten W rter die ggf mit einem bestehenden W rterbuch oder so genannten Stopplisten abgeglichen M gge 2007 Zerfa 2006 beschreibt statistische Extraktionsverfahren folgenderma en Bei einsprachigen Dokumenten werden die Termini anhand von relativer H ufigkeit aus dem Text extrahiert Bei zweisprachigen Dokumenten z B Translation Memory Dateien oder bilingualen Dateien aus der berset zung kommt noch die Suche nach der passenden bersetzung des Terminus in der Zielsprache dazu Auch hier wird in statistischen Systemen nach der H ufigkeit entschieden mit der ein Terminus in der bersetzung mit dem Terminus in der Ausgangssprache korrespondiert Da f r dieses Verfahren kein morphologisches Hintergrundwissen n tig ist kann man mit einem statis tisch arbeitenden System alle Sprachen bearbeiten 5 N Grame sind eine Folge benachbarte Elemente Buchstaben oder W rter sic 12 Terminologieextraktion 4 3 5 Linguistische Extraktionsverfahren F r dieses Verfahren ben tigt das System umfangreiches Wissen ber die Sprache aus der extrahiert wird Termini werden nicht aufgrund der H ufig
47. f Negativbenennungen also Benennungen die in AVL Dokumentationen nicht verwendet werden sollen hingewiesen Da es mitunter vorgekommen ist dass dennoch Synonyme verwendet wurden sollte diese Arbeit dazu beitragen sie aufzuzeigen Das Qualifzieren der Synonyme als akzeptierte Benennungen beziehungsweise Negativbenennungen obliegt den AVL Mitarbeitern im Zuge der Validierungsphase siehe Kapitel 7 9 und ist nicht Teil dieser Masterarbeit Tab 1 bersicht Extraktionsmaterial de amp en Dokumentationsgruppe de Seiten en Seiten Seiten CAMEO 378 376 754 EMCON Systemhandbuch 310 310 620 Pr fstandkupplung 34 34 68 Kalibrierung_Drehmoment_Messflansch_Messwelle 62 62 124 Reifenschlupfsimulation 42 42 84 EMCON_gesamt 448 448 896 Indiziertechnik 212 208 420 SANTORIN Benutzerhandbuch 158 160 318 Daten Manager 194 192 386 Security Manager 38 32 70 SANTORIN gesamt 390 384 774 GESAMT 1428 1416 2844 17 Exkurs Datenkategorien 6 Exkurs Datenkategorien In Kapitel 5 2 1 wurde bereits erw hnt dass es eine der AVL Vorgaben war Daten elemente f r Datenkategorien aus den zur Verf gung gestellten Dokumentationen zu extrahieren In diesem Zusammenhang soll auf die Erkenntnisse der Onlineumfrage von Zielinski und Safar 2005 hingewiesen werden bersetzer Dolmetscher und Terminologen sind nicht nur daran interessiert Termini und deren ziel sprachliche Entsprechungen zu extrahieren
48. ge asynchronous foot mounted system Abb 33 ProTerm TermBank Sprachebene 61 ProTerm 7 6 4 Termebene Auf der Termebene wird der aktuell ausgew hlte Term angezeigt und er kann ma nuell nachbearbeitet werden Das Bearbeiten einer Benennung ist eine n tzliche Funktion die zur Anwendung kommt wenn Termini nicht in ihrer Grundform in die TermBank bernommen wurden zum Beispiel bei Termini im Plural flektierten Ter mini o Die Quelle zu jedem Term wird von ProTerm automatisch bernommen unter der Voraussetzung dass w hrend des Extraktionsprozesses eine Datenkate gorie ausgew hlt wurde von der die Quelle dann f r den betreffenden Term ber nommen werden kann Es besteht die M glichkeit aus den eingelesenen Texten die Datenelemente f r die Datenkategorien Explikation Definition Kontext und Kolloka tion hinzuzuf gen zu bearbeiten oder zu l schen Ein Anmerkungsfeld auf Term ebene dient dazu etwaige den Term betreffende Kommentare zu machen Die Fel der Multimedia Benennungstyp Kundenspezifische Verwendung Wortart Nume rus Regionale Verwendung Sprachregister Genus Workflow und Publiziert wurden im Rahmen dieser Masterarbeit nicht verwendet und seien hiermit nur der Vollst n digkeit halber erw hnt siehe Abb 34 D Ausrei er erkennen Ausrei er deaktivieren Benennungstyp VB Regionale Abk Verwendung Syn Kundenspezifische Sprachregister Verwendung Wort
49. he Term kandidaten durchsucht die wiederum im Anschluss in ProTerm gesucht und dem ausgangssprachlichen TK hinzugef gt wurden siehe Kapitel 7 3 Um die Suche noch rascher zu gestalten w re es von Vorteil wenn bei der Weiterentwicklung von ProTerm das Auffinden der zielsprachlichen Kapitel automatisiert werden w rde De tails dazu siehe Kapitel 0 7 5 Revision Bei der Revision wurde in der TermBank kontrolliert ob f r jeden Eintrag beide Sprachen vorhanden waren Wie in Kapitel 7 3 erw hnt ist es f r den Export aus ProTerm wichtig dass jeder Termkandidat ein quivalent in der anderen Sprache hat Handelt es sich um eine Null bersetzung wurde ein leerer Eintrag in der ande ren Sprache angelegt Nur so konnte der Export erfolgreich durchgef hrt werden Bei der Revision wurde zudem darauf geachtet dass keine farblich hinterlegten Da tenkategorien vorhanden waren da dies zu einem Mehrfachexport gef hrt h tte Um die Projekte den Dokumentationsgruppen zuzuordnen wurde das Feld Projekt In formation auf Begriffsebene der TermBank dazu genutzt zwischen den Dokumenta tionsgruppen zu unterscheiden 7 6 TermBank Die ProTerm TermBank ist eine begriffsorientierte Terminologiedatenbank Sie be steht aus einem bersichtsfeld aller Eintr ge 1 und drei Ebenen der Begriffsebe ne 2 der Sprachebene 3 und der Termebene 4 siehe Abb 29 Im TermBank Manager Administration gt TermBank Manager siehe Abb 52 k nne
50. hnischen Fachsprache handelte die systematisch von Dokumentationsexperten erstellt wurden wurde das Auffinden der 79 Schlussbetrachtung passenden zielsprachlichen quivalenten erheblich beschleunigt Auf menschliches Zutun kann daher auch bei der TE mit ProTerm nicht verzichtet werden An dieser Stelle soll nochmal auf Zerfa 2006 verwiesen werden die verdeutlicht dass eine automatische Extraktion ihre Grenzen hat Grenzen die f r den Menschen nicht existieren der trotz Rechtschreibfehler oder der fehlenden Grundform des Terminus eine Beziehung z B zur korrekten bersetzung erkennen kann weil er den Text versteht Um die Zuordnung der zweisprachigen TK noch rascher zu gestalten w re es von Vorteil wenn bei der Weiterentwicklung von ProTerm das Auffinden der zielsprachlichen Kapitel automatisiert werden w rde Dies k nnte folgenderma en gestaltet werden sobald ein TK im AT und das dazugeh rige Datenelemente f r eine Datenkategorie ausgew hlt wurde ffnet sich ein Fenster mit dem entspre chenden zielsprachlichen Kapitel und der Terminologe spart somit Zeit bei der Su che nach dem ZT Kapitel siehe Kapitel 7 4 und muss lediglich den zielsprachlichen TK identifizieren Eine Evaluierung von ProTerm oder ein Vergleich mit anderen TET anhand der Noise Silence beziehungsweise Recall Precision Parameter siehe Ka pitel 4 3 7 hat sich als nicht zweckm ig erwiesen Grund daf r ist dass ProTerm Benennungen extr
51. hoden new angenommen Einzelwerte Automatischen zusammengefasst gestatet Anwendungen Rechner Grenze Datei Stufen Verzeichnis Kanalnamen Protokoll linear interpoliert ausgenommen Benennung bearbeiten Datei Abb 47 ProTerm Normierung aufheben 75 ProTerm ProTerm Datei Term Administrati PRoOTerm Filter JAVL_INDIZIERTECHNIK_de y Einlesedatum 2009 08 27 23 48 AT2645D_04_IndiPar_Mess Differenz ver ndert NewTerm Methoden angenommen Einzelwerte Automatischen zusammengef new Se m ng gestartet new Anwendungen new Rechner new Ge Dat ne Stufen new Verzeichnis Kanalnamen new Protokoll selektieren Mal linear interpoliert ausgenommen E AVL_INDIZIERTECHNIK Abb 48 ProTerm Normierung aufgehoben 76 ProTerm 711 Andere Methoden Zu Beginn dieses Masterarbeitsprojektes wurden berlegungen angestellt wie mit ProTerm zweisprachig Terminologie extrahiert werden kann Die oben angef hrte Methode erwies sich dabei als am wenigsten zeitintensiv Im Folgenden sollen die anderen Ans tze vorgestellt werden 711 1 Ein Filter mit allen Dokumenten einer Dokumentations gruppe Technische Texte weisen naturgem einen hohen Fachlichkeitsgrad auf Es wurde daher angenommen dass ein in einer Sprachversion vorkommender Fachterminus dieselbe H ufigkeit in Dokumenten sowie absolute H ufigkeit des Terminus selbst siehe Kapitel 7 2 5 1
52. ie Qualit t der extrahierten Termkandidaten das entscheidende Bewertungskriterium Die Genauigkeit von TETs wird in der Regel mit den Ma en noise und silence sowie recall und precision ausgedr ckt W hrend noise sich auf das Verh ltnis zwischen den abgelehnten und den angenommenen TK bezieht gibt silence die Anzahl der von einem TET nicht erkannten Termini an Recall und precision sind zwei Ma e die oft im IR angewendet werden Das ers tere wird als das Verh ltnis zwischen der Summe korrekt gewonnener Termini und der Summe der existierten Termini definiert das letztere als das Verh ltnis zwischen korrekt extrahierten Termini und der Summe vorgeschlagener TK vgl Zielinski 2002 Zielinski und Safar 2005 Eckstein 2009 stellt fest dass es f r die Evaluierung und den Vergleich eines Terminologieextraktionsprogramms bislang kein standardisiertes Modell gibt Sie stellt folgende Bewertungskriterien vor Noise bezieht sich auf das Verh ltnis zwischen relevanten und irrelevanten Termkandidaten gilt also als Ma f r ungewollte extrahierte Termkandidaten die anschlie end manuell vom Terminologen aus der Ergebnisliste gel scht wer den Als Silence werden die Termkandidaten bezeichnet die bei der Extraktion unentdeckt bleiben und ebenfalls manuelle Nacharbeit Nacherfassung erfordern W hrend der Recall Auskunft dar ber gibt wie viele relevante Termkandida ten im Verh ltnis zu Gesamtzahl relevan
53. iert Kollokationen wie folgt Wiederkehrende im Zusammen hang stehende Wortkombination deren Komponenten in einer u erung oder einer Reihe von u erungen zusammen auftreten auch wenn diese nicht unbedingt in unmittelbarer N he zueinander stehen Die Kollokation ist ein sprachliches Ph nomen das in der syntagmatischen Untersuchung der lexikalischen Ebene eine relevante Rolle spielt und das mit der typischen konventionellen rekurrenten Art der Kombination von Wort schatzelementen zu tun hat Es handelt sich um das Problem pr ferierter Verbindbarkeit von Lexemen um die Tatsache dass einige Wortverbindungen ohne syntaktische oder semantische Regeln zu verletzen nicht usuell sind aber auch um die Tatsache dass die Wahl eines Lexems die Wahl eines Part nerlexems festlegt Rothkegel 1994 499f Als Beispiel f r Kollokationen wer den u a die folgenden gefunden eingefleischter Junggeselle den Tisch de cken starker Raucher Kaffee trinken Diese Beispiele haben gemeinsam dass in ihnen die Verben oder Adjektive also die Kollokatoren keine oder wenige Synonyme aufweise und dass auch wenn rein theoretisch das gleiche mit and ren Adjektiven oder Verben ausgedr ckt werden k nnte Kaffee nehmen eingefleischter Raucher dies aus Gr nden der Norm im Sinne Coserius also der Konvention nicht g ngig ist Cedillo 2004 31f 20 Exkurs Datenkategorien 6 4 Kontext Im Sinne der Terminologiearbeit Sprach
54. ihrer Grundform extrahiert worden sein ProTerm erm glicht es nach Belieben Datenelemente f r Datenkategorien aus den eingelesenen Texten zu extrahieren Dabei ist es u erst hilfreich dass es in jeder Arbeitsphase m glich ist in die Dokumentansicht und die Originaltextansicht zu wechseln Der Terminologe kann sich also jederzeit w hrend des Extraktionsprozes ses ein Bild davon machen wie die Benennungen im Originaltext verwendet werden und bei Bedarf eine oder mehrere Textstelle n mit zu extrahieren was f r die wei tere Arbeit mit der gewonnen Terminologie von Vorteil ist Die Tatsache dass die Quelle der Originaltexte automatisch extrahiert wird erspart dem Terminologen viel Zeit bei der anschlie enden Zuordnung der TK zu den Originaltexten Das Erstellen von Anmerkungen auf jeder TermBank Ebene kann f r die interne Kommunikation im Rahmen eines Projektes genutzt werden Das parallele Arbeiten auf mehreren Instanzen siehe Kapitel 7 2 2 und das Zuordnen eines TK zu einem bestehenden Eintrag in einer anderen Sprache siehe Kapitel 7 3 erm glicht die zweisprachige TE Das Auffinden der zielsprachlichen quivalente obliegt allerdings der Kompetenz des Terminologen Er ist nicht nur daf r verantwortlich einen TK zu identifizieren sondern muss sein zielsprachliches quivalent in den Originaltexten ausfindig ma chen Da es sich bei den f r diese Arbeit zur Verf gung gestellten Texten aus schlie lich um Dokumentationen aus der tec
55. ilfe der Trunkierungsfunktion mit ein Eintrag ge sucht werden siehe Abb 31 Termbankinhalt AVL_CAMEO map smoothing map value maps import and assignment maps table Abb 31 ProTerm TermBank Termbankinhalt 7 6 2 Begriffsebene Auf der Begriffsebene k nnen Projekt Information Ansprechpartner der Workflow Status oder das Fachgebiet angegeben werden Zudem besteht die M glichkeit eine Multimedia Datei hochzuladen oder eine Anmerkung zu schreiben siehe Abb 32 Im Zuge dieser Masterarbeit wurden auf Begriffsebene ausschlie lich die Felder Projekt Information und Anmerkung verwendet Das Feld Projekt Information ist f r einen reibungslosen Export aus ProTerm notwendig siehe Kapitel 7 7 Je nach Pro jekt kann im TermBank Manager eine weitere Projekt Information hinzugef gt wer den Anmerkungen die auf der Begriffsebene gemacht werden gelten f r die Be nennungen in allen Sprachen 60 ProTerm Begriff A sw EMCON Projekt Information CAMEO SANTORIN Ansprechpartner e st de te O Publiziert Abb 32 ProTerm TermBank Begriffsebene 7 6 3 Sprachebene Auf der Sprachebene k nnen der jeweiligen Sprache beliebig viele Benennungen hinzugef gt oder vorhandene Eintr ge gel scht werden Im TermBank Manager k nnen Sprachen hinzugef gt durch Klicken auf die rechte Maustaste ge ndert oder gel scht werden siehe Abb 33 AFA Asynchrone Fu Anla
56. ilter anhand des Einlesedatums ausgew hlt werden ProTerm erstellt eine Liste mit den Benen nungen Diese Benennungen sind Tokens vor und oder nach deren Auftreten sich im Text ein Stopp Wort und oder ein Sonderzeichen befindet siehe Abb 10 Es werden nicht nur Einwortbenennungen dargestellt sondern auch Mehrwortbenen nungen Als Ausgangssprache f r die TE wurde Deutsch gew hlt da es die Aus gangssprache der Originaldokumente sowie die Muttersprache der Autorin ist was die Identifikation von TK erleichterte Durch Doppelklicken auf eine Benennung oder Markierung einer Benennung und Klicken auf das Icon Dokument anzeigen am rech ten Bildschirmrand kann in die Dokumentansicht siehe Abb 11 und anschlie end in das Originaldokument gewechselt werden In der Dokumentansicht kann mittels der Suchfunktion Strg F nach einer beliebigen Benennung gesucht werden Diese Funktion und das Wechseln in die Originaltextansicht erm glichen es dem Termino logen sich w hrend des Extraktionsprozesses ein Bild von der Umgebung des TK zu machen Die in NewTerm ausgew hlte Benennung ist farblich hervorgehoben siehe Abb 11 35 ProTerm NewTerm zeigt Ergebnisse des Einlesevorgangs Filter und Einleseda Parameter Kategorisie Termini tum ausw hlen bearbeiten rung anzeigen kategorisieren ProTerm caes a FO KOTEM eee eee NewTerm A dee DIE H lt Modellparameter gt lt Wert gt OffSetMode new 3 3
57. im zielsprachlichen Text aufweist Das Einlesen der Dokumen te beider Sprachen h tte daher im Idealfall zu englischen und deutschen Sprachpaa ren nach ihrer absoluten H ufigkeit f hren sollen Diese Methode wurde verworfen da die angezeigten Benennungen in ProTerm von Stopp W rtern oder Sonderzei chen abgegrenzt sind und dies aufgrund der Syntax der beiden Sprachen nicht eins zu eins bernommen werden kann 7 11 2 pdf Dokumente kapitelweise einlesen Das Einlesen beider Sprachversionen in einen Filter war nicht von Erfolg deshalb wurden berlegungen angestellt wie Termini die in den ausgangssprachlichen Tex ten gefunden wurden schnellstm glich in den zielsprachlichen Texten zu identifizie ren sind Die pdf Dokumente wurden in ihre einzelnen Kapitel zerlegt und in einen f r beide Sprachen erstellten Filter eingelesen Das Ziel dieses Ansatzes war es aufgrund der erh hten H ufigkeit der Dokumente die zielsprachlichen quivalente zeitsparender zu identifizieren Das Identifizieren in der daraus folgenden gr eren Anzahl von Teil Dokumenten erwies sich jedoch als zeitintensiver als urspr nglich gedacht weshalb der Entschluss gefasst wurde die Dokumente als Ganze einzule sen Die idente H ufigkeit der Benennungen in den gesplitteten Dokumenten war auch bei diesem Ansatz in den beiden Sprachversionen nicht einwandfrei gegeben 77 78 Schlussbetrachtung 8 Schlussbetrachtung Zum Abschluss dieser Arbeit soll
58. ine Datenkategorie ausgew hlt so kann manuell eine Quelle eingegeben werden Sollte keine Quelle eingetragen werden wird der TK trotzdem der Term Bank hinzugef gt Unabh ngig davon ob eine Datenkategorie ausgew hlt oder eine Quelle angegeben wurde erscheint das AddNewTerm Fenster siehe Abb 27 Hier wird die Sprache ausgew hlt und angegeben ob in der TermBank ein neuer Eintrag anzulegen oder der TK einem bestehenden Eintrag hinzuzuf gen ist Das 8 Sobald eine Benennung der TermBank hinzugef gt wird wird sie als Termkandidat bezeichnet 52 ProTerm Auffinden eines bestehenden Eintrags ist mithilfe der Trunkierungsfunktion m glich In der TermBank wird nun der neu angelegte oder der zu einem bestehenden Ein trag hinzugef gte TK angezeigt Wurde wie bereits erw hnt keine Quelle angege ben und ist somit eine leere Datenkategorie vorhanden so ist dieses Feld in blass roter Farbe hinterlegt siehe Abb 28 Die farblich hinterlegten leeren Felder erleich tern das Auffinden leerer Datenkategorien die vor dem Export zu l schen sind um einen Mehrfachexport zu vermeiden In der TermBank k nnen nach Belieben weite re Datenkategorien hinzugef gt werden Durch Klicken auf das Icon Hinzuf gen ff net sich erneut ein SelectSentence Fenster Als Voraussetzung f r einen erfolgrei chen Export der Termkandidaten aus der ProTerm TermBank ist eine Projekt Information anzugeben und darauf zu achten dass wenn ein
59. inologieextraktion bersetzen Lehrveranstaltungen Franz sisch Medizin Tourismus Sport Englisch Naturwissenschaften Pers nliches Interesse Europ ische Union Recht Wirtschaft Naturwissenschaften Europ ische Union Wirtschaft Geisteswissenschaften Immobilien Management und Organisation Wirtschaft Landwirtschaft Weinbau Technik Technologie Sport Medien und Kommunikation Versicherungswesen Lokalisierung Berufserfahrung 04 2010 laufend 04 2009 07 2010 03 2009 laufend 08 2008 09 2007 02 2008 07 2006 08 2006 06 2008 Wissenschaftliche Projektmitarbeiterin Terminologieextraktion Wissenschaftliche Mitarbeiterin Praktikum Karenzvertretung Praktikum Escort McDonalds Kids UEFA Euro 08 Universit t Wien Projekt TES4IP www univie ac at transvienna AVL List GmbH www avl com Infoterm Internationales Informationszentrum f r Terminologie www infoterm org Immoconsult Leasingges m b H Gesch ftsf hrung www immoconsult eu Welcome Touristic www fussballeskorte at 98 Curriculum Vitae 06 2007 08 2007 09 2006 05 2007 04 2006 05 2006 04 2005 05 005 IT Skills MS Office Word Excel PowerPoint Access Praktikum Rechtsabteilung Shop Assistant Liaison Officer Media Host ProTerm Terminologieextraktion SDL International MultiTerm amp Trados TermStar NXT webEdition Lotus Notes SPSS ArcGIS
60. isten und der H ufigkeitsanalyse geschenkt Durch die Koordination dieser beiden Schritte soll n mlich das manuelle Zutun und somit der Einsatz humaner Ressour cen im Zuge der TE so gering wie m glich gehalten werden Die im Zuge der TE gewonnenen Termini sollen dazu dienen den Terminologiebestand der AVL zu er weitern Aus den zur Verf gung gestellten Dokumentationen sollen nicht nur Termini extrahiert werden sondern soweit vorhanden und als relevant erachtet auch Da tenelemente f r andere Datenkategorien Ein zweitrangiges Ziel dieser Arbeit be steht darin die Entwickler von ProTerm dabei zu unterst tzen das Tool weiter zu entwickeln und seine Effizienz bei der Terminologiearbeit zu erh hen Es wird darauf abgezielt so viele Schritte wie m glich w hrend des Extraktionsprozesses zu auto matisieren also mithilfe des TETs durchzuf hren Terminologieextraktion 4 Terminologieextraktion 4 1 Texttyp Textsorte In diesem Kapitel werden die Texte die im Zuge dieser Masterarbeit bearbeitet wur den analysiert Es handelt sich um Texte die prim r Informationen vermitteln Kadric et al 2005 78 und daher k nnen sie dem informativen Texttyp zugeordnet werden Die Bezeichnung dieser Textsorte ist im Deutschen etwas problematisch Im Englischen trifft die hyperonymische Bezeichnung manuals den gemeinten Begriff recht gut Gelegentlich verwendet man auch im Deutschen den Ausdruck Manual als Lehn
61. keit extrahiert sondern das System versteht wo in einem Satz z B das Subjekt oder das Objekt steht mit welchen anderen W rtern es h ufig zu sammen vorkommt Als extrahierter Terminus wird es in der Regel auf seine Grundform zur ckgef hrt und als Termkandidat markiert Die linguistische Analyse der Sprache erfordert ein gro es W rterbuch der Sprache sowie ein Regelwerk Daher sind Extraktionsprogramme die linguistisch arbeiten auf die Sprachen beschr nkt f r die sie entwickelt wurden Zerfa 2006 Zielinski und Safar 2005 f hren aus dass inguistisch basierte TETs Termini anhand ihrer morphologischen oder syn taktischen Struktur erkennen Dazu werden in einem ersten Schritt Texte von morphologischen Analyseprogrammen Wortarten Taggern und Parsern mit linguistischer Information annotiert Dann werden die TK mit einer bestimmten Tagstruktur aus dem annotierten Text mit Hilfe von Methoden der Musterer kennung Pattern matching herausgefiltert Bei den termbasierten Methoden werden TK nach ihrer inneren Struktur gefiltert z B nach ihrer morphologi schen Struktur beispielsweise Zylinderabschaltung ds zylinder ab_ schal ten ung Bei kontextbasierten Methoden werden TK durch die Analyse der morphosyntaktischen Struktur eines Wortes oder einer Phrase erkannt d h durch die Filterung einer Wortarten Abfolge wie NP Nomen Nomen e g printer menu Eine weitere Technik beruht auf der Filterung von TK durch die
62. liche oder au ersprachliche Umgebung in der eine Benennung oder eine Fachwendung auftreten kann DIN 2342 1 1992 Soukup Unterweger 2002 Schmitz 2003 charakterisiert Kontext als Text oder Teil eines Textes in dem eine Benennung erscheint Arntz et al 2009 defi nieren Kontext folgenderma en Die Angabe des Kontextes sollte das Fachwort in seiner typischen Anwendung darstellen damit kann der Kontext zugleich zum Ver st ndnis der Bedeutung des Fachwortes beitragen Warburton 2008 definiert Kontext kurz und b ndig wie folgt Text or part of a text in which a term occurs Die Bedeutung von Kontexten im Rahmen der TE untersuchen Zielinksi und Safar 2005 im Zuge einer Onlineumfrage zum Einsatz von Terminolo gieextraktions und Terminologieverwaltungstools Der Grund daf r kann darin ge sehen werden dass der Kontext f r gew hnlich eine sehr wichtige Rolle bei der Be stimmung der terminologischen Relevanz einer lexikalischen Einheit und damit f r die Termerkennung spielt 21 22 ProTerm 7 ProTerm ProTerm ist das Werkzeug f r der Firma ProCom Strasser Im Vorfeld der Maste rarbeit wurde ProTerm f r Dokumentation Recherche Pflege von Thesaurus Ver waltung semantischer Netze Navigation in Dokumenten Beschlagworten von Do kumenten und Kommunikation intern und extern vgl DocuMatrix 2007 verwendet Folgende Formate k nnen in ProTerm eingelesen und bearbeitet werden
63. m Was Sie wissen sollten 10 AVL CAMEO V3 2 1 1 5 ber diese Dokumentation Basis f r diese Dokumentation ist das CAMEO Release Inhalt amp Umfang Der CAMEO V3 2 1 User s Guide Bascis beschreibt Standardfunktionen und Verfahren die Sie f r Ihre Arbeit mit CAMEL Um Ihnen das Vorgehen beim Edemen und Verwenden von CAMEO zu efeichtem ist dieser User s Guide entsprechend dem CAMEO Was Sie wissen sollten 12 AVL CAMEO V3 2 1 13 User s GuideBasics CAMEO Erste Schritte 2CAMEO Erste Schritte Was ist de Dieser Abschnitt f hrt Sie in die ersten Schritte mit CAMEO ein Kapitel bersicht 2 1 CAMEO starten und beenden W hrend des Installationsprozesses f gt die Installationsroutine im Windows Startme Kapitel Inhalt CAMEO starten und beenden auf Seite 13 Hier erfahren Sie welche Einstellungen Sie vomehmen m ssen wenn Sie CAMEO Benutzeroberfl che auf Seite 19 Was zeigt die Benutzeroberfl che Elemente und Funktionen der CAMEO Benutzeroberfl che Basics amp Beyond the Basics Users GuideBasics AVL CAMEO V3 2 1 Februar 2009 AT3050D Der Inhalt dieser Dokumentation darf ohne vorherige schriftliche Zustimmung von AVL weder ganz noch teilweise in irgendeiner Form reproduziert oder an dritte Personen weitergegeben werden Abb 25 ProTerm SelectSentence Fenster Textpassage S tze 54 ProTerm ProTerm Datei ProTerm Administration Info AVL
64. n Europe and UTF 8 as well accessing the source text at any level Every term candi date and every data category added to the TermBase is extracted automatically together with its source Truncation allows keeping consistency of terminology The terminologist has to identify term candidates and their corresponding equivalents in the target texts by combining parameter settings with the administration of stop lists The results of this Master s Thesis shall contribute to further develop bilingual termi nology extraction with ProTerm Inhaltsverzeichnis 4 5 6 Inhaltsverzeichnis ale 1 5 A ebe ee 7 Terminologieextraktion o o edo ono 9 AA TEX E 9 4 2 Was ist Terminologieextraktion ENNEN 10 4 3 Terminologieextraktionsverfanren ee 10 4 3 1 Manuelle Extraktion ee 10 4 3 2 Toolgest tzte Terminologieextraktion nn 11 4 3 3 Konkordanzwerkzeuge EEN 11 4 3 4 Statistische Extraktionsverfahren 12 4 3 5 Linguistische Extraktionsverfanren een 13 4 3 6 Hybride Extraktionsverfahren en 13 4 3 7 Evaluierungskriterien f r Terminologieextraktionstools 14 ellen EE 15 Bet Gre E EE 15 5 1 1 ProCom Strasser amp DocukMat AEN 15 5 1 2 Zentraldokumentation der Landesverteidigungsakademie 15 5 1 3
65. n Kategorien hinzugef gt ge ndert oder entfernt werden siehe Abb 30 In Tab 3 wird ein ber blick ber die im Zuge der TE mit ProTerm verwendeten Icons gegeben Bei den in dieser Arbeit behandelten Texten handelte es sich um technische Fachtexte die syste matisch erstellt wurden was das Auffinden der jeweiligen zielsprachlichen Aquivalente mithilfe der Kapitel beziehungsweise Seitenangabe erheblich erleichterte 57 ProTerm ProTerm EX Datei ProTerm Administration Info PRolerm Je Anova table Anova Tabelle Antwortgr e Anwender Applikationsingenieur area of application NewTerm Ausgangsgr e Ausreiber Auswertung Ausrei er Messausrei er E en outliers AusreiBer erkennen AusreiBer deaktivieren Abb 29 ProTerm TermBank 58 ProTerm ProTerm Datei ProTerm Administration Info PRolerm TBDet Projekte E C AVL_EMCON gt alle AVL SANTORIN Keine AVLINDIZIERTECHN C UniversityTerm lt Wortart gt all dl e a Abb 30 ProTerm TermBank Manager Tab 3 ProTerm TermBank Icons Icon Anwendung ndern o Hinzuf gen FY L schen ffnen e 59 ProTerm 7 6 1 Termbankinhalt Im bersichtsfeld werden alle Eintr ge der TermBank in alphabetischer Reihenfolge aufgelistet Im Suchfeld kann mith
66. n dieser Arbeit waren Definition und Kontext verf gbar 11 Im Moment ist Automatisches Trunkieren durch Bet tigen der Funktionstaste F3 siehe Kapitel 10 2 m glich 80 Schlussbetrachtung Zum Schluss soll noch einmal auf den bedeutendsten Vorteile von ProTerm hinge wiesen werden ProTerm erm glicht es dem Terminologen w hrend des Extrakti onsprozesses Terminologie zu bearbeiten und zus tzliche Informationen aus den eingelesene Texten zu extrahieren somit wird der Nachbearbeitungsaufwand des Terminologen erheblich reduziert 81 82 Literaturverzeichnis 9 Literaturverzeichnis Arntz Reiner Heribert Picht und Fritz Mayer Einf hrung in die Terminologiearbeit Hildesheim u a Olms 2009 Cedillo Ana Caro Fachsprachliche Kollokationen T bingen Narr 2004 Dahlberg Ingetraut Conceptual definitions for INTERCONCEPT International Classification 1981 8 Ausgabe zitiert in Arntz Reiner Heribert Picht und Fritz Mayer Einf hrung in die Terminologiearbeit Hildesheim u a Olms 2009 DIN 2330 Begriffe und Benennungen Allgemeine Grunds tze Berlin K ln Beuth 1993 zitiert in Arntz Reiner Heribert Picht und Fritz Mayer Einf hrung in die Terminologiearbeit Hildesheim u a Olms 2009 DIN 2342 Teil 1 Begriffe der Terminologielehre Grundbegriffe Berlin K ln Beuth 1992 zitiert in Soukup Unterweger Irmgard Ein praxisorientiertes Terminologieverwaltungsmodell f r d
67. n werden ebenfalls von AVL entwickelt und vermarktet Motorenmesstech nik und Testsysteme Die Produkte dieses Bereiches umfassen alle Ger te und Anlagen die f r das Testen von Motoren und Fahrzeugen erforderlich sind AVL Unternehmen 2010 Derzeit werden f r diese Produkte ca 32 000 Seiten Kundendokumentation betreut Die Dokumentation wird zun chst auf Deutsch erstellt und danach ins Englische bersetzt Weitere bersetzungen erfolgen je nach Bedarf in den Tochterunternehmen Die bersetzungen werden mit dem Translation Memory System Transit der Firma STAR erstellt Gasser 2004 Im Folgenden wird das Unternehmen AVL LIST GmbH kurz als AVL gef hrt 16 Kooperationspartner 5 2 1 Vorgaben AVL AVL hat aus vier Dokumentationsgruppen siehe Tab 1 CAMEO EMCON Indiziertechnik und SANTORIN neun pdf Dokumente von insgesamt 2844 Seiten in deutscher und englischer Sprache in elektronischer Form zur Verf gung gestellt Die Vorgaben von AVL lauteten m glichst viele Fachtermini aus allen in den Dokumentationen vorhandenen Fachgebieten und ad quate Daten f r zus tzliche Datenelemente f r Datenkategorien Definitionen Kontexte Explikationen und Kollokationen siehe Kapitel 6 zu extrahieren sowie auf etwaige synonyme Verwendungen aufmerksam zu machen Die AVL Terminologiearbeit sieht keine Verwendung von Synonymen in ihren Dokumentationen vor In der AVL Terminologiedatenbank wird daher au
68. ng ausgegeben Basis Richtung anschlie end Abb 20 ProTerm NewTerm Gefiltert nach Benennungen die fter als zweimal auftreten 45 ProTerm e ZLen In diesem Feld kann nach der Anzahl der Zeichen einer Benennung gefiltert werden Durch Klicken auf den Spaltenkopf ZLen k nnen die Ergebnisse in aufsteigender oder absteigender Reihenfolge angezeigt werden Mithilfe der Verh ltniszeichen Gr er als gt und Kleiner als lt ist es m glich das Ergebnis zu verfeinern siehe Abb 21 ProTerm Datei ProTerm Administration Info PROTerm MS el Einlesedatum 2003 10 08 11 13 DE_AT1374D09_CDC_BMt el Differenz w InTerm E NewTerm hardware Variante Regelung mm g i CANCOM2 new ih ea Abb 21 ProTerm NewTerm Benennungen mit acht Zeichen werden angezeigt 46 ProTerm f Len In diesem Feld kann nach Mehrwortsequenzen gefiltert werden siehe Abb 22 Durch Klicken auf den Spaltenkopf Len k nnen die Ergebnisse in aufsteigender oder absteigender Reihenfolge angezeigt werden Mithilfe der Verh ltniszeichen Gr er als gt und Kleiner als lt ist es m glich das Ergebnis zu verfeinern ProTerm Cep Datei ProTerm Administration Info e Fil PROlerm ilter AVL_INDIZIERTECHNIK_en E Einlesedatum 2009 08 27 23 42 AT2645E_04_IndiPar_Acqu Differenz E InTerm further information new New em shortcut menu real
69. nnnnnnnnnnnnnnnn 38 Abb 14 ProTerm NewTerm Benennung Trunkierung indizierter A 39 Abb 15 ProTerm NewTerm Benennung Trunkierung orafik 40 Abb 16 ProTerm NewTerm Gefiltert nach Status 41 Abb 17 ProTerm NewTerm Gefiltert nach H ufigkeit der Dokumente absteigend 42 Abb 18 ProTerm NewTerm Gefiltert nach H ufigkeit der Dokumente in mehr als sechs eingelesenen Dokumenten aratan RE 43 Abb 19 ProTerm NewTerm Max Gefiltert nach H ufigkeit absteigend 44 Abb 20 ProTerm NewTerm Gefiltert nach Benennungen die fter als zweimal auftreten 45 Abb 21 ProTerm NewTerm Benennungen mit acht Zeichen werden angezeigt 46 Abb 22 ProTerm NewTerm Benennungen bestehend aus zwei 47 Abb 23 ProTerm NewTerm Auswahlmen Farbkoderumg nennen 50 Abb 24 ProTerm NewTerm Zeige Drei Wort Benennungen die fter als zweimal auftreten nach ihrer absoluten H ufigkeit sortiert 2 200444400nnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnn nen 51 Abb 25 ProTerm SelectSentence Fenster Textpassage 54 Abb 26 ProTerm SelectSentence Fenster Textpassage
70. ntwortlichen technischen Autoren bergeben und auf ihren Fachlichkeitsgrad berpr ft Im Bedarfsfall wurde R cksprache mit Ansprechpartnern im Projekt zum Beispiel Mitarbeiter aus der Entwicklungsabteilung oder dem Projektmanagement gehalten Die validierten Termkandidaten wurden abschlie end als Termini in die AVL Terminologie datenbank bernommen 7 10 Stopp Wort Listen StW Listen dienen dazu festzulegen welche Termini w hrend dem Einlesen ausge schlossen werden und somit im Einleseergebnis nicht aufscheinen Zielinski und Sa far 2005 definiert Stopp Wort Listen folgenderma en Stoppwortlisten beinhalten leere Worte die uninteressant f r den Terminologen sind da sie keine termi nologischen Einheiten darstellen und sie automatisch aus den TK Listen entfernt werden sollen Trotzdem werden diese Worte oft wegen ihrer morphosyntaktischen Struktur oder ihres h ufigen Vorkommens als TK herausgefiltert Im Zuge dieser Masterarbeit werden Stopp Wort Listen dazu verwendet nicht erw nschte Term kandidaten schon vor dem Einlesen der Texte auszuschlie en Im Vorfeld wurde bereits erw hnt dass w hrend der Auswahl der Termkandidaten angezeigte Benennungen ebenfalls als Stopp W rter kategorisiert werden k nnen Stopp W rter werden in den StW Listen gespeichert und k nnen mithilfe des Stopp Wort Editors siehe Abb 39 und Abb 40 verwaltet werden 68 ProTe rm ProTerm Datei ProTerm e Ben
71. ologieextraktionsprogramm Eckstein 2009 StW Listen Stopp Wort Listen AT Ausgangstext ZT Zieltext TK Termkandidat 10 4 Tabellenverzeichnis Tab 1 bersicht Extraktionsmaterial EE 17 Tab 2 bersicht TE E 35 Tab 3 ProTerm TermBank Jong 59 Tab 4 Ergebnis Terminologicextraktion nn anne 67 Tab 5 ProTerm FUNKtIONStASTON 92 Tab 6 Abk rzungsverzeichznis cooooocccconococccononnnccononnncnonononcnnnnnnnccnnn nn ncnnnn rn nn cnn rn nr cnn rn 93 93 Anhang 10 5 Abbildungsverzeichnis Abb 1 Prozess Terminologieextraktion mit Pro lem 25 ADb 2 Pro Ru Ee EE 27 Abb 3 ProTerm Neues Projekt anlegen AA 28 Abb 4 ProTerm Neuen Filter anlegen 29 Abb 5 ProTerm Projekt AVL Indiziertechnik und Filter 30 Abb 6 ProTerm Filter AVL_ Jndtziertechnik 31 Abb T Filter aktivigren A EAR AEEA AARE EAR 32 Abb 8 ProTerm Einlesevorgang starten 33 Abb 9 ProTerm Ergebnis des ElnlesevorgangS 34 Abb 10 ProTerMi NeW EE 36 Abb 11 ProTerm Dokumentansicht Suche in 37 Abb 12 ProTerm NewTerm Parameter 37 Abb 13 ProTerm NewTerm Benennung Trunkierung winkel usersnsenssennn
72. onnte sichergestellt werden dass keine bereits in der AVL Terminogie datenbank existierenden Termini als TK angezeigt werden Nachdem eine Doku mentationsgruppe abgeschlossen war wurden die dort generierten Stopp W rter und die akzeptierten TK im nachfolgenden Projekt als StW Listen erstellt und einge lesen Dadurch wurde wiederum vermieden dass bereits w hrend des Projektes ausgew hlte Termkandidaten und Stopp W rter eines vorherigen Projektes nicht nochmals angezeigt werden Dieser Vorgang wurde f r jedes Projekt wiederholt und sollte dazu dienen TK rascher ausfindig zu machen indem das Einleseergebnis so komprimiert wurde 72 ProTerm 7 10 3 Generieren von Stopp W rtern w hrend des Auswahl verfahrens W hrend des Auswahlverfahrens k nnen als Stopp W rter gew nschte Benennun gen durch Bet tigen der Funktionstaste F6 oder durch Klicken auf die Schaltfl che Stopp Wort Liste einer zuvor generierten Stopp Wort Liste hinzugef gt werden sie he Abb 44 und Abb 45 ProTerm Datei ProTerm Administration Info prRolerm Filter AVL_INDIZIERTECHNIK_de y Einlesedatum 2009 08 27 23 48 AT2645D_04_IndiPar_Mess y DI Differenz AA DOOR NewTerm Methoden angenommen Einzelwerte Automatischen Benennung bearbeiten means Grenze 1 1 6 4 Datei new 5 101 51 10 a eS Stufen Verzeichnis Kanalnamen Protokoll 5 selektieren Mal linear interpoliert ausgenomm
73. r Filter f r alle Texte einer AVL Dokumentationsgruppe siehe Abb 5 und Abb 6 29 ProTerm ProTerm Datei Info Neues Projekt anlegen Projektname JAVL_INDIZIERTECHNIK Filter AVL_INDIZIERTECHNIK_de AVL_INDIZIERTECHNIK_en AVL_INDIZIERTECHNIK Abb 5 ProTerm Projekt AVL Indiziertechnik und Filter 30 ProTerm Datei Info Filter ndern y JAVL_INDIZIERTECHNIK J Filter als Batch Startdatum yyyymmdd Zeit It E Periodisch Intervall 5 LC JW Ordner Verzeichnis C Dokumente und ffnen inkl Unterordner Speicheroptionen C Dateisystem Datenbank Verzeichnis ffnen Quelldateien l schen Dateien hinzuf gen Aktueller Benutzer Es ist niemand eingeloggt Aktuelles Projekt Abb 6 ProTerm Filter AVL_Indiziertechnik 7 2 4 InTerm Einlesen der Dokumente Das Einlesen der Dokumente erfolgt ber die Aktivierung des Filters Nachdem Pro jekt und Filter angelegt wurden erscheint ein Fenster das dazu auffordert den zu letzt bearbeiteten Filter zu aktivieren siehe Abb 7 Filter k nnen auch in Administ ration gt Projekteditor siehe Abb 52 bearbeitet werden Nachdem der Filter ange legt wurde ist er durch Klicken auf das Icon InTerm am linken Bildrand zu starten In diesem Bereich besteht die M glichkeit zwischen den Filtern eines
74. rendium info pic papers EAMT 2003 TExt article pdf 2003 zitiert in Zielinski Daniel und Yamile Ram rez Gatar Eine Onlineumfrage zum Einsatz von Terminologieextraktions und Terminologie verwaltungstools Sprachdatenverarbeitung Fachrichtung 4 6 Angewandte Sprachwissenschaft sowie bersetzen und Dolmetschen Universit t des Saarlandes Saarbr cken 2005 Zerfa Angelika Terminologieextraktion eD Tion 2006 21 25 Zielinski D Computergest tzte Termextraktion aus technischen Texten Italienisch Saarbr cken Universit t des Saarlandes Diplomarbeit Letzte berpr fung 28 06 05 URL http fr46 uni saarland de index php id 433 2002 zitiert in Zielinski Daniel und Yamile Ramirez Safar Eine Onlineumfrage zum Einsatz von Terminologieextraktions und Terminologieverwaltungstools Sprachdatenverarbeitung Fachrichtung 4 6 Angewandte Sprachwissenschaft sowie bersetzen und Dolmetschen Universit t des Saarlandes Saarbr cken 2005 84 Literaturverzeichnis Zielinski Daniel und Yamile Ramirez Safar Eine Onlineumfrage zum Einsatz von Terminologieextraktions und Terminologieverwaltungstools Sprachdatenverarbeitung Fachrichtung 4 6 Angewandte Sprachwissenschaft sowie bersetzen und Dolmetschen Universit t des Saarlandes Saarbr cken 2005 Internetquellen AVL Unternehmen 2010 http www avl com Letzter Zugriff am 17 Februar 2010 DocuMatrix http www documatrix com Letz
75. riffssystems festgelegt und beschrieben und damit gegen ber anderen Begriffen abgegrenzt Die Definition bildet die Grundlage f r die Zuordnung einer Benennung zu einem Begriff ohne sie ist es nicht m glich einem Begriff eine geeignete Benennung zuzuordnen Zus tzliche Informationen enth lt die Definition von Dahlberg 1981 17 A de finition is the equivalence between a definiendum what is to be defined and a definiens how is something to be defined for the purpose of delimiting the understanding of the definiendum in any communication case Die Definiti 19 Exkurs Datenkategorien on ist eine Gleichung bei der auf der linken Seite der durch eine Benen nung ausgedr ckte Begriff das Definiendum und auf der rechten Seite die In haltsbeschreibung des Begriffs das Definiens steht Arntz et al 2009 59f Im Rahmen dieser Arbeit wird auf den Wunsch der AVL hin darauf geachtet die Formulierung der Definitionen so einfach wie m glich zu halten Beispiel Gl hlampe ein materieller lichtaussendender Gegenstand bei dem feste Stoffe durch Stromwarme so hoch erhitzt werden dass sie Licht aussenden Arntz et al 2009 62 6 2 Explikation Schmitz 2003 beschreibt Explikation folgenderma en Aussage die einen Begriff beschreibt und ihn verst ndlicher macht ihn allerdings nicht unbedingt von anderen Begriffen abgrenzt 6 3 Kollokation Schmitz 2003 defin
76. ski und Safar 2005 M gge 2007 und Eckstein 2009 wird im Rahmen dieser Arbeit der Terminus Terminologieextraktion mit der Kurzform TE verwendet 3 In dieser Masterarbeit wird die Benennung Terminologieextraktionstool TET verwende vgl Zie linski und Safar 2005 Zerfa 2006 spricht von Termextraktionsprogrammen Eckstein 2009 von Terminologieextraktionsprogrammen TEP und Lieske 2002 von Term Extraktions Werkzeugen TEW Einleitung Im anschlie enden Teil werden die Kooperationspartner dieser Masterarbeit sowie ihre Anforderungen an das Projekt Terminologieextraktion mit ProTerm pr sentiert Ein kurzer Exkurs gibt im Anschluss einen berblick ber die extrahierten Daten elemente f r Datenkategorien Der folgende Teil stellt das TET ProTerm vor und zeigt wie die im Rahmen dieser Arbeit die zweisprachige TE stattgefunden hat Zum Abschluss wird die Arbeit mit ProTerm kritisch analysiert Ziele der Arbeit 3 Ziele der Arbeit Das Ziel dieser Arbeit besteht darin das TET ProTerm f r die zweisprachige TE zu testen und den Terminologiebestand der AVL LIST GmbH zu erweitern Zu diesem Zweck hat die AVL LIST GmbH das notwendige Datenmaterial zur Verf gung ge stellt In dieser Arbeit soll festgestellt werden ob TE mit ProTerm m glich ist und wie mit ProTerm zweisprachig Terminologie extrahiert werden kann Besondere Beach tung bei der TE mit ProTerm wird der Verwaltung von Stopp Wort Listen StW L
77. sonal zeit sic und kostenintensiv ist M gge 2007 4 3 2 Toolgest tzte Terminologieextraktion Neben der manuellen Terminologieextraktion kann sich der Terminologe auch von spezieller Software zur Terminologieextraktion unterst tzen lassen Genau wie die Systeme zur automatischen Terminologieextraktion filtern halbautomatische TEP die Termkandidaten auf der Basis linguistischer sta tistischer oder kombinierter Verfahren aus einem Text Bei der halbauto matischen TE ist anschlie end die Pr fung und Entscheidung durch den Ter minologen notwendig Dieser beurteilt ob ein Termkandidat tats chlich ein Terminus ist und in die Terminologiesammlung aufgenommen wird Bei der automatischen TE entf llt dieser Schritt da die Software selbst eine berpr fung und Gewichtung der TK vornimmt Eckstein 2009 4 3 3 Konkordanzwerkzeuge Mithilfe von Konkordanzprogrammen oder Konkordanzfunktionen in Transla tion Memory Systemen kann eine Liste aller W rter erstellt werden Je nach Einstellungen k nnen hier Einwort und oder Mehrwort Termini aufgelistet werden Diese Listen sind meist sehr umfangreich allerdings bieten sie den Vorteil dass keine Termini vergessen werden Zerfa 2006 Stehen Paralleltexte d h Originaltext und bersetzung in maschinenlesba rer Form zur Verf gung werden in einem ersten Schritt die einzelnen S tze Segmente im Quelltext ihrer jeweiligen Entsprechung in der bersetzung z
78. sprozesses f gt die Installationsroutine im Windows Startmen dem Men Pr M Basics amp Beyond the Basics Users GuideBasics AVL CAMEO V3 2 1 Februar 2009 AT3050D Der Inhalt dieser Dokumentation darf ohne vorherige schriftliche Zustimmung von AVL weder ganz noch teilweise in irgendeiner Form reproduziert oder an dritte Personen weitergegeben werden Ge La gt DI a 0 Abb 27 ProTerm AddNewTerm Fenster 55 ProTerm ProTerm Datei ProTerm Administration Info BG Begriff Projekt Information Vache Antriebsmotor Antriebsschrank Antriebsstrang Anwendungsnorm APA application standard NewTerm Arbeitskontakt Kurzform Langform ASM Asynchronmaschine Asynchronmaschine ASM Asynchronous dynamometer 113 Era Leere Datenkategorie beim Hinzuf gen des Termkandidaten zur TermBank wurde keine Datenkategorie ange geben El E IS _ Abb 28 ProTerm Neuer Eintrag in TermBank 7 4 Identifizieren von Termkandidaten Zerfa 2006 stellt in den Raum dass die Extraktion von Terminologie eine sehr subjektive Angelegenheit ist und vom Kenntnisstand der Materie des Terminolo gen und der Zielsetzung f r die weitere Verwendung der Terminologie Zerfa 2006 beeinflusst ist Eine der AVL Vorgaben lautete so viele Fachtermini wie m g lich z
79. ter Termkandidaten innerhalb des Text materials vom Extraktionsprogramm gefunden werden gibt Precision an wie vie le vom Programm ausgegebene Kandidaten wirklich relevant sind und hat somit wiederum Einfluss auf den Nachbearbeitungsaufwand durch den Terminologen Als weitere Evaluierungskriterien f r werden in der Literatur technische Aspekte die Bedienoberfl che sowie Benutzerfreundlichkeit allgemein unter st tzte Formate beim Import und Export und andere M glichkeiten des Daten austauschs die Unterst tzung von Sprachen und Mehrsprachigkeit Parametri sierbarkeit Methoden im Validierungsprozess sowie konomische Aspekte ge nannt Eckstein 2009 Kooperationspartner 5 Kooperationspartner 5 1 ProTerm 5 1 1 ProCom Strasser 8 DocuMatrix ProCom Strasser versteht sich als umfassende sic Partner f r den effizien ten Umgang mit Content Die Palette beinhaltet das zielgenaue Beschaffen von relevanten Informationen in unterschiedlichen internen und externen Da tenquellen die Verwaltung von Informationen auch in Terabyte Mengen den Aufbau die Pflege und den Einsatz von Thesauri und semantischen Netzwer ken Semantic Web Company 2010 ProTerm ist das Werkzeug f r Terminologie Verwaltung zur Erstellung und Pflege komplexer Thesauri und Semantischer Netze ProCom Strasser 2009 Die DocuMatrix Output und Informationstechnologie Consulting GmbH ist in Bera tung Produkt
80. ter Zugriff am 3 Mai 2010 sterreichs Bundesheer 2010 http www bundesheer at organisation beitraege lvak zdok shtml Letzter Zugriff am 3 Mai 2010 ProCom Strasser 2009 http www procom strasser com Letzter Zugriff am 3 Mai 2010 Semantic Web Company 2010 http www semantic web at 1 20 resource 35 procom strasser htm Letzter Zugriff am 3 Mai 2010 Warburton Kara LISA Terminology Survey LISA 2008 http www lisa org LISA Terminology Sur 464 0 html Letzter Zugriff am 12 Februar 2010 Witschel Hans Friedrich GLDVPreis 29 Juni 2005 http wortschatz uni leipzig de fwitschel papers GLDVPreis pdf Letzter Zugriff am 27 April 2010 85 86 Anhang 10 Anhang 10 1 Benutzeroberfl che ProTerm In den folgenden Abbildungen wird die Benutzeroberfl che von ProTerm f r die TE dargestellt Abb 49 ProTerm Benutzeroberfl che Start 87 Anhang Projekt wechseln Einstellungen Beenden Prolerm ProTerm Administr Projekt wechseln Einstellungen Abb 50 ProTerm Benutzeroberfl che Datei 88 Anhang Abb 51 ProTerm Benutzeroberfl che ProTerm 89 Anhang ProTerm Datei ProTerm H EC S 2 Benutzerverwaltung P RC Te r Projekteditor Thesaurusverwaltung Caption Editor Kategorie Editor Stopp Wort Editor Stopp Wort Kommission Prolerm Not Wort Editor nn Administration Proler Projekteditor Thesaurusverw
81. time GigaBit systems indicom ini file characteristic values maximum value Continuous Acquisition Result values Conditioning Equipment Channel Browser E list i 5 AVL_INDIZIERTECHNIK Abb 22 ProTerm NewTerm Benennungen bestehend aus zwei W rtern 47 ProTerm g Normiert Durch das Bet tigen dieses Schalterknopfes kann nach den zugewiesenen Normie rungen gefiltert werden Im Zuge dieser Masterarbeit wurde dieses Feld nicht ver wendet und soll daher nur der Vollst ndigkeit halber erw hnt werden h Auswahlmen Das Auswahlmen erm glicht die Filterung nach den zugewiesenen Kategorisierun gen Alle Anzeigen Neu Akzeptiert Not Wort Liste Stopp Wort Liste Normierte Thesaurus siehe Fehler Verweisquelle konnte nicht gefunden werden Nach Auswahl einer der Kategorisierungen wird ausschlie lich diese angezeigt Im Zuge dieser Arbeit wurde immer mit Alle anzeigen gearbeitet da so dank der Farbkodie rungen siehe Fehler Verweisquelle konnte nicht gefunden werden ersichtlich war welche Benennung im Vorfeld welcher Kategorie zugewiesen wurde 48 ProTerm ProTerm Datei ProTerm Administration Info AVL_INDIZIERTECHNIK_de v Einlesedatum 2009 08 27 23 48 AT2645D_04_IndiPar_Mess EI Differenz InTerm E NewTerm Eckpunkte Operation Positionen Tastenkombination new Messbereichs verwendeten Ablauf age m
82. u geordnet In einem zweiten Schritt wird dann mithilfe linguistischer und oder Eckstein 2009 verwendet die Abk rzung TEP f r Terminologieextraktionsprogramme In dieser Arbeit wird daf r der Terminus Terminologieextraktionstool TET verwendet 11 Terminologieextraktion statistischer Methoden ggf unter Einsatz von W rterb chern ein zweispra chiges Glossar der in diesen Texten verwendeten fachsprachlichen Benen nungen erzeugt M gge 2007 4 3 4 Statistische Extraktionsverfahren Zielinski und Safar 2005 stellen folgende berlegungen zu statistischen Extrakti onsverfahren in den Raum Statistische Ans tze basieren auf der Annahme dass die Wiederholung ge wisser lexikalischer Einheiten oder morphosyntaktischer Konstruktionen cha rakteristisch f r Fachtexte ist Durch die Anwendung verschiedener statisti scher Methoden filtern statistisch basierte TETs W rter und Phrasen aus einem Text heraus die mit einer H ufigkeit im Text vorkommen die ber ei nem gegebenen Schwellenwert liegt Termbasierte statistische Methoden be rechnen die Struktur eines TK beispielsweise anhand der N Grammstruktur Oft wird die Struktur existierender Termini mit der von W rtern oder Phrasen eines Korpus verglichen um TK mit hnlichen N grammstrukturen sic her auszufiltern Eine weitere verbreitete Methode st tzt sich auf die Annah me dass Termini in Fachtexten h ufiger als in allgemeinsprachlichen T
83. u extrahieren Diese Fachtermini sollten einen m glichst hohen Fachlich keitsgrad aufweisen und so viele Fachgebiete wie m glich abdecken Um so rasch wie m glich die gew nschten Fachtermini identifizieren zu k nnen wurden vor Be ginn der ersten TE die bestehenden Eintr ge der AVL Terminologiedatenbank und der Text der Dokumentationsgruppe CAMEO gewissenhaft studiert Dies sollte dazu beitragen dass w hrend der TE ohne gro en Zeit und Rechercheaufwand und mit hilfe der Parametereinstellungen Termkandidaten ausfindig gemacht werden k nn ten Eine weitere Hilfe bei der Auswahl der TK war eine intensive Auseinanderset zung mit dem Inhalts dem Index und wenn vorhanden dem Abk rzungsverzeich nis 56 ProTerm Diese Verzeichnisse lie en ebenfalls auf potentielle TK schlie en und wurden zu Beginn jeder Dokumentationsgruppe untersucht Anschlie end wurde mithilfe der Parameter wie in Kapitel 7 2 5 1 beschrieben gearbeitet Zuerst wurden wie bereits erw hnt die deutschen Texte bearbeitet und anschlie end wurden die englischen Texte auf m gliche im Deutschen nicht ersichtliche TK durchsucht Das Auffinden der jeweiligen zielsprachlichen quivalente erfolgte durch Einsicht in die Originaldo kumente Dabei wurde ber cksichtigt in welchen Kapiteln und je nach Dokumenta tion auf welcher Seite der Termkandidat verwendet wurde Diese Textstellen wur den dann in den entsprechenden Textpassagen der Zielsprache auf m glic
84. und L sungsverkauf bis hin zur Implementierung und Wartung von L sungen die im Web und Multichannel output Bereich angesiedelt sind DocuMatrix 2007 t tig Ihre Aktivit ten konzentrieren sich auf Firmenweite Output l sungen hochvolumiger batchorientierter Output transaktionaler Output Preview Browserbasierende Administration und berwachung sowie Webapplikationen mit Client Server hnlicher Charakteristik DocuMatrix 2007 DocuMatrix hat gemeinsam mit ProCom Strasser ProTerm entwickelt um das sys tematische Arbeiten mit Terminologie zu erleichtern DocuMatrix 2007 Weitere Informationen ber ProCom Strasser und DocuMatrix sind auf folgenden Websiten zu finden www procom strasser com und www documatrix com 5 1 2 Zentraldokumentation der Landesverteidigungsakademie Im Rahmen einer Abl se einer Suchmaschine f r das sterreichische Bundesheer wurde f r die Unterst tzung einer semantischen Suche die Entwicklung von Pro Term von Anwenderseite unterst tzt Amtsdirektor Hans Christian Pilles von der Zentraldokumentation der Landesverteidigungsakademie Bundesministerium f r Landesverteidigung war der Hauptansprechpartner f r alle ProTerm Anliegen und technischen Fragen Die Zentraldokumentation der Landesverteidigungsakademie ist die interne milit rische Fachinformationsstelle f r das sterreichische Bundesheer Ihre Aufgabe ist es aus eigenen Datenbanken dem Internet Zeitungen Zeit Kooper
85. universit t wien MASTERARBEIT Titel der wissenschaftlichen Arbeit Die Anwendbarkeit des Tools ProTerm f r die zweisprachige Terminologieextraktion Eine Untersuchung unter besonderer Ber cksichtigung der H ufigkeitsanalyse und Verwendung von Stopp Wort Listen am Beispiel von AVL Produktliteratur Verfasserin Verena Christina Bleich Bakk phil angestrebter akademischer Grad Master of Arts MA Pamhagen im Juni 2010 Studienkennzahl It Studienblatt 060 345 342 Studienrichtung It Studienblatt bersetzen Betreuer Univ Prof Mag Dr Gerhard Budin Danksagung Danksagung An dieser Stelle m chte ich Herrn Univ Prof Mag Dr Gerhard Budin f r die wis senschaftliche Betreuung und seine konstruktiven und fachlichen Hinweise danken Ein herzlicher Dank gilt Frau Mag Irmgard Soukup Unterweger MAS MSc f r ihre wertvollen und unverzichtbaren Ratschl ge Sie hat nicht nur mein Interesse an Terminologiearbeit geweckt sondern ist f r die Inszenierung dieser Masterarbeit verantwortlich Herrn Amtsdirektor Hans Christian Pilles Zentraldokumentation der Landesverteidi gungsakademie sei ein ganz besonderer Dank f r seine kritischen Anmerkungen und sein pers nliches Engagement bei der Umsetzung der technischen nderungen ausgesprochen F r die produktive Zusammenarbeit und die reibungslose Koordination seitens der AVL List GmbH m chte ich Herrn Klaus Baumgartner MSc sehr danken M
86. utzerverwaltung Ale erojextecitor anzeigen 2 Thesaurusverwaltung He anzegen S E Caption Editor Alle anzeigen Differenz Ur Kategorie Editor r Stopp Wort Kommission Not Wort Editor a Not Wort Kommission verandert Sonderzeicheneditor Lower Idiom Editor Methoden TermBank Manager angenommen Einzelwerte zusammengefasst gestartet Anwendungen Rechner Grenze Not Wort i never Benennung bearbeiten Dokument a AVL_INDIZIERTECHNIK Abb 39 ProTerm Stopp Wort Editor StweEditor PT_sentences PT_tems RW_DE_STAN RW_EN_STAN Standard Deutsch Standard Englisch Std Deutsch _de_AVL_Indiziertechni stw_de_AVL_MA stw_en_AVL_CAMEO stw_en_AVL_EMCON stw_en_MA TemTurk_Demo_de TemTirk Demo en Abb 40 ProTerm Stopp Wort Editor H 69 ProTerm Der Stopp Wort Editor dient dazu neue StW Listen hinzuzuf gen bestehende StW Listen zu ndern oder zu l schen Durch Klicken auf die Schaltfl che Suchen kann nach bestehenden Stopp W rtern gesucht werden Mithilfe der Import und Export funktion k nnen StW Listen innerhalb eines Projektteams m helos ausgetauscht werden 7 10 1 Erstellen neuer Stopp Wort Listen Durch Klicken auf die Schaltfl che Hinzu kann eine neue StW Liste erstellt werden siehe Abb 41 Die Stopp W rter k nnen manuell eingegeben siehe Abb 42 oder als txt Format importiert werden siehe Abb 42 und Abb 43 StwEditor
87. wort mit englischer Aussprache selten auch phonetisch und hinsichtlich Deklination ans Deutsche assimiliert als Manual pl Manuale Gemeint sind damit jene Teile einer Produktdokumentation in denen der Benutzer eines Produkts mit dem Produkt und dessen Gebrauch Bedienung Betrieb Instandhaltung und oder Instandsetzung vertraut ge macht werden soll Im Gegensatz zum en Ausdruck manual der von ei nem einzelnen Blatt ber ein geklammertes Heft bis zu mehrb ndigen B chern alles abdeckt kann der dt Ausdruck Handbuch nur auf solche Doku mentationen bezogen werden die tats chlich die Merkmale eines Buches Bindung mit R cken auch Ringb cher aufweisen Schmitt 2003 Bei den von der AVL zur Verf gung gestellten Texten handelt es sich um Fachtexte Ein Wesensmerkmal von Fachtexten ist deren sprachliche Spezialisierung Diese Spezialisierung kommt vor allem in der Verwendung von fachspezifi schen Benennungen zum Ausdruck d h in der Fachsprache werden Benen nungen verwendet die entweder in der Gemeinsprache berhaupt nicht ver wendet werden z B Benutzeroberfl che in der Informatik oder in der Fach sprache f r einen anderen Begriff stehen z B Mutter in der Mechanik als in der Gemeinsprache Deshalb k nnen Fachtexte nur dann sachlich richtig von einer Sprache in eine andere bertragen werden wenn bei der bersetzung die entsprechende multilinguale Terminologie zur Verf gung steht M gge 2007

Download Pdf Manuals

image

Related Search

Related Contents

Optoma EH7500  Avaya one-X™ Mobile for S60 3rd Edition Dual  Tripp Lite Cat6, 2.13m  GPS VEHICLE TRACKER USER MANUAL  iPod nano Manuale Utente  Oasis Pro 30 Premium LIMPIADOR PARA SUELOS DE COCINA  究極×進化 究極×進化  3.1-9 CHRYSO DecoLav N  Measuring the Dissolved Oxygen of Wine in Tanks  OTS80PB and OTS60PB Portable oil test sets  

Copyright © All rights reserved.
Failed to retrieve file