Jak vylepšit výsledky strojového překladu

I přes dynamický vývoj překladačů v posledních letech se nelze při použití strojového překladače spolehnout na vysoce přesný překlad srovnatelný s překladem lidským. Proto vám přinášíme několik užitečných rad a tipů, jak ke strojovému překladu přistupovat a čím lze ovlivnit celkovou kvalitu přeloženého výstupu.

Nechte natrénovat překladač na svoji terminologii

Nejmodernější metodou pro zvýšení kvality strojového překladače je jeho přizpůsobení pro lepší překlad určitého typu textu. Tento proces přizpůsobení se nazývá doménová adaptace. Pro trénování překladačů jsou zapotřebí paralelní korpusy z daného oboru, tedy takové, které obsahují stejné texty v obou jazycích daného jazykového páru vedle sebe. Paralelní data jsou získávána z veřejně dostupných zdrojů. Procházejí několika stupni filtrování, které se provádí pro každý větný pár zvlášť. Přizpůsobení rovněž zahrnuje „výuku“ strojového překladače o slovní zásobě a frázích, které jsou běžné v daném oboru. Výsledkem je natrénovaný a kvalitní překladač, přinášející obrovské výhody v nákladech na překlad. Problematice doménové adaptace se budeme věnovat v některém z dalších vydání našeho zpravodaje.

Naučte se psát texty vhodné pro strojový překlad

Další možností, jak dosáhnout lepších výsledků je optimalizace zdrojového textu. Úpravou formulace můžeme překladači ulehčit  práci s problematickými obraty a tím posílíme jeho schopnost generovat kvalitní výstup. Je jasné, že komplikované větné struktury jsou náchylnější k chybám než text s jednoduchými větami a běžnou slovní zásobou. A které zásady to jsou?

  • používejte krátké a srozumitelné věty
  • ujistěte se, že struktura věty je jednoduchá a dobře napsaná
  • pokud není překladač adaptovaný na vaší doménu, vyhněte se průmyslovému žargonu
  • vyvarujte se použití slangových výrazů
  • dejte pozor na složená nebo dvojznačná slova

 

Doveďte překlad k dokonalosti díky post-editaci

Jednou z běžně používaných metod je technika zvaná post-editace strojového překladu. V procesu post-editace upraví profesionální překladatel nebo post-editor strojově přeložené texty (tzn. raw machine translation) a to v takové míře, aby dosáhl požadované kvality. Tento proces je většinou rychlejší než samotný překlad bez využití strojového překladu. I přes nezanedbatelnou úsporu času a nákladů nelze jednoznačně říci, že celková úspora je vysloveně dramatická. Post-editaci dělíme na:

Základní post-editace (light post-editing)

Tato služba spočívá v revizi provedené post-editorem, který kontroluje zejména smysl překladu porovnáním zdrojového textu s cílovým. Výsledkem je srozumitelný text, aniž by se zásadně změnil jeho styl.

Úplná post-editace (full post-editing)

Úplné post-editační úpravy zahrnují vyšší úroveň intervence k dosažení co nejvyššího stupně požadované kvality. Očekává se, že finální překlad bude nejen srozumitelný, ale také perfektní po stylistické stránce. Takto upravený výstup je svojí úrovní k nerozeznání od lidského překladu.

Prekladače LINGEA súčasťou boja proti počítačovej kriminalite

Spoločnosť LINGEA sa od septembra podieľa na boji proti počítačovej kriminalite ...

viac tu

Jak vylepšit výsledky strojového překladu

I přes dynamický vývoj překladačů v posledních letech se nelze ...

viac tu


Novinky z poslednej doby nájdete v archíve. ...