Babel Speaks Hindi

Zdeněk Wagner

Zpravodaj Československého sdružení uživatelů TeXu (2007)

  • Volume: 017, Issue: 1, page 12-20
  • ISSN: 1211-6661

Abstract

top
Babel provides unified interface for creation of multilingual documents. Unfortunately none of Indic languages is currently supported. Typesetting in Indic languages is based on specialised packages. The most advanced from them is Velthuis Devanīagarī for TeX because it already provides Hindi captions as well as a macro for a Europian style date. A language definition file for plugging Hindi into babel has therefore been recently developed. The second part of the paper explains differences between UNICODE and Velthuis transliteration. This is important for understanding the tool that can convert Hindi and Sanskrit documents from MS Word and OpenOffice.org into TeX via an XSLT 2.0 processor and a Perl script as well as a method of making the PDF files searchable. Finally the paper discusses some possibilities of further development, mainly the advantages offered by XeTeX and by forthcoming integration of LUA into pdfTeX.

How to cite

top

Wagner, Zdeněk. "Babylón mluví hindsky." Zpravodaj Československého sdružení uživatelů TeXu 017.1 (2007): 12-20. <http://eudml.org/doc/298501>.

@article{Wagner2007,
abstract = {Babel poskytuje jednotné rozhrani pro tvorbu vícejazyčných dokumentů. V současné době není bohužel podporován žádný z indických jazyků. Sazba v indických jazycích je založena na specializovaných balíčcích. Nejpokročilejším z nich je Velthuis Devanīagarī for TeX, protože již obsahuje hindské nadpisy i makro pro tisk data v evropském stylu. Definiční soubor pro začlenění hindštiny do babelu byl tedy v sooučasné době vyvinut. Druhá část článku vysvětluje rozdíl mezi UNICODE a Velthuisovou transliterací. To je důležité pro pochopení nástroje sloužícího ke konverzi hindských a sanskrtských dokumentů z MS Wordu a OpenOffice.org do TeXu pomocí procesoru XSLT 2.0 a perlovského skriptu, jakož i metody, jak lze vytvořit prohledávatelný PDF soubor. Závěrem článek diskutuje možnosti dalšího vývoje, zejména možnosti, jež nabízí XeTeX a integrace jazyka LUA do pdfTeXu. Práce byla prezentována na konferenci TUG 2006 v Marrákéši a zveřejněna v angličtině v TUGboatu. Český překlad je publikován se souhlasem organizátorů konference i redakce TUGboatu.},
author = {Wagner, Zdeněk},
journal = {Zpravodaj Československého sdružení uživatelů TeXu},
language = {cze},
number = {1},
pages = {12-20},
publisher = {Československé sdružení uživatelů TeXu},
title = {Babylón mluví hindsky},
url = {http://eudml.org/doc/298501},
volume = {017},
year = {2007},
}

TY - JOUR
AU - Wagner, Zdeněk
TI - Babylón mluví hindsky
JO - Zpravodaj Československého sdružení uživatelů TeXu
PY - 2007
PB - Československé sdružení uživatelů TeXu
VL - 017
IS - 1
SP - 12
EP - 20
AB - Babel poskytuje jednotné rozhrani pro tvorbu vícejazyčných dokumentů. V současné době není bohužel podporován žádný z indických jazyků. Sazba v indických jazycích je založena na specializovaných balíčcích. Nejpokročilejším z nich je Velthuis Devanīagarī for TeX, protože již obsahuje hindské nadpisy i makro pro tisk data v evropském stylu. Definiční soubor pro začlenění hindštiny do babelu byl tedy v sooučasné době vyvinut. Druhá část článku vysvětluje rozdíl mezi UNICODE a Velthuisovou transliterací. To je důležité pro pochopení nástroje sloužícího ke konverzi hindských a sanskrtských dokumentů z MS Wordu a OpenOffice.org do TeXu pomocí procesoru XSLT 2.0 a perlovského skriptu, jakož i metody, jak lze vytvořit prohledávatelný PDF soubor. Závěrem článek diskutuje možnosti dalšího vývoje, zejména možnosti, jež nabízí XeTeX a integrace jazyka LUA do pdfTeXu. Práce byla prezentována na konferenci TUG 2006 v Marrákéši a zveřejněna v angličtině v TUGboatu. Český překlad je publikován se souhlasem organizátorů konference i redakce TUGboatu.
LA - cze
UR - http://eudml.org/doc/298501
ER -

References

top
  1. Pandey, Anshuman, Devanāgarī for TeX, http://devnag.sarovar.org/. 
  2. Aliprand, Joan, The Unicode Standard, chapter South Asian Scripts. The Unicode Consortium, 2003. http://www.unicode.org/faq/indic.html#5 (2003) 
  3. Hagen, Hans, LuaTeX: Howling to the moon, TUGboat, 26(2):152–157, 2005. http://www.tug.org/TUGboat/Contents/contents26-2.html. (2005) 
  4. International components for Unicode, http://icu.sourceforge.net/ 
  5. Kay, Michael, SAXON: The XSLT and XQuery Processor, http://saxon.sourceforge.net/. 
  6. Olšák, Petr, encTeX, http://www.olsak.net/enctex.html 
  7. <oXygen/> XML editor, https://www.oxygenxml.com/ 
  8. Pango, http://www.pango.org/ 
  9. Píška, Karel, Indic Type 1 fonts for TeX, CTAN:fonts/ps-type1/indic. 
  10. Transliteration pages, http://homepage.ntlworld.com/stone-catend/translit.htm 
  11. Wagner, Zdeněk, Můj volně šiřitelný software, http://icebearsoft.euweb.cz/sw.php 
  12. Wagner, Zdeněk, Prohledávatelné pdf s dévanágarskými texty, http://icebearsoft.euweb.cz/dvngpdf/. 
  13. Wagner, Zdeněk, Babel speaks Hindi, TUGboat, 27(2):176–180, 2006. (2006) 
  14. The XeTeX typesetting system, http://scripts.sil.org/xetex 

NotesEmbed ?

top

You must be logged in to post comments.

To embed these notes on your page include the following JavaScript code on your page where you want the notes to appear.

Only the controls for the widget will be shown in your chosen language. Notes will be shown in their authored language.

Tells the widget how many notes to show per page. You can cycle through additional notes using the next and previous controls.

    
                

Note: Best practice suggests putting the JavaScript code just before the closing </body> tag.