Dictionary

Bestehende Projekte

 * Beolingus, TU Chemnitz, de-en-Wortliste GPL, Rest unbekannt http://dict.tu-chemnitz.de/
 * dict.cc, basiert auf TU Chemnitz-Liste, ist selbst unter unfreien Bedingungen, http://www.dict.cc
 * Versch. Sprachen, Lizenzinfos teils unklar, scheint eher inaktiv, http://freedict.org/
 * Einsprachig englische Wortsammlung, PD
 * EU-Daten, Lizenzinfos widersprüchlich http://sprachennetz.blogspot.com/2008/01/eu-kommission-vereinfacht-zugang-zu.html
 * Freeware mit Source und DB, keine Lizenzinfos, http://www.h-wessel.de/sblt.html
 * englisch-esperanto in PD von gutenberg/archive.org http://www.archive.org/details/englishesperanto16967gut
 * wiktionary comes quite close, it's cc-by-sa, http://en.wiktionary.org/
 * da steht es soll ein opensource projekt werden, ist es aber noch nicht, http://dicdata.de/
 * en-walisisch http://www.gutenberg.org/ebooks/19704
 * 1999 eingestelltes Projekt, unbedingt genauer anschauen, copyright-bedingungen sehr liberal http://www.june29.com/IDP/IDPfiles.html
 * j2me-app mit vielen möglichen quellen http://dictionarymid.sourceforge.net/dict.html
 * http://pylyglot.org/ - spezialisiert auf Lokalisierung von Software, sonst vergleichbar
 * http://open-tran.eu/ - spezialisiert auf Lokalisierung von Software, sonst vergleichbar

Kooperation
Projekte mit ähnlicher Zielsetzung, die wir unterstützen könnten / sollten:
 * Wiktionary
 * die ganze DICT-Szene, z.B.
 * freedict.org
 * stardict.org/forum

eventuell vielleicht irgendwann auch mal
 * OpenThesaurus

Material

 * Suche nach gemeinfreien Werken

DE - EN

 * http://www.archive.org/details/dictionarygerma00bellgoog
 * http://www.archive.org/details/newcompletedicti02kaltiala

There's a lot more, but most, including pretty much all with google source, are of rather low quality (OCR).

Good ones:
 * http://www.archive.org/details/8bkde10 (damn, this is NOT free)

Gemeinfreie fertige Wörterbücher

 * http://www.archive.org/details/dictionarygerma00bellgoog
 * http://www.archive.org/details/newcompletedicti02kaltiala

Webster's Dictionary:
 * Gutenberg: v0.4, "NOT up to Project Gutenberg standards", "help us fix errors!", "field marks "<...>" in this version are copyrighted, actual dictionary entries in the Public Domain"

Grady Wards Moby enthält Wortlisten, Thesaurus, ... und scheint in die Gemeinfreiheit übergeben worden zu sein:
 * ftp://ftp.dict.org/dict/raw/Moby/, gutenberg.org/ebooks/3202 (english thesaurus), gutenberg.org/ebooks/3206 (Wortlisten für Deutsch, Französisch, Italienisch, Japanisch und Spanisch), gutenberg.org/ebooks/3201 (Wortliste für Englisch)


 * http://www.gutenberg.org/files/18251/18251-h/simple.html#page332 Englisch-Latein-Vokabeln

Datenformate, Standards
-> Translation memory and related standards
 * CSV
 * Text Encoding Initiative
 * DICT
 * TBX
 * TMX?

Software

 * OpenLogos: http://logos-os.dfki.de/release/pg_esense.dump
 * http://sourceforge.net/projects/freedict/ - hat neben den GPL-Wörterbüchern eventuell interessante Dateiformatkonverter
 * in Übersetzungsspeicher-Software (CAT-Software) findet sich Code zum Auffinden korrespondierender Textabschnitte aus übersetzten Texten (teils auch mit Möglichkeit zur manuellen Unterstützung der Automatik)

Bitext word alignment
Gibt einiges freies; vielversprechend könnten sein:
 * Natura Alignment Tools
 * The Berkeley Word Aligner