Комитет по терминологии при Академии наук Респубдики Таджикистан совместно со Школой информационной и коммуникационной технологии проектировали и создали корпус национального таджикского языка. Намечается построить корпус таджикского языка на базе не менее 10 миллионов слов таджикского текста.
По замыслу создателей корпус национального таджикского языка в нем размещаются прежде всего тексты, отражающие активную лексику современного таджикского языка. В корпус будут включены различные тексты, охватывающие все аспекты и сфер действия современного таджикского языка, в частности:
образцы текстов наследия самых знаменитых и любимых поэтов классического периода (Рудаки, Фирдавси, Хайям, Хафиз, Руми и др);
различные жанры прозы и поэзии современной литературы;
тексты выпущенные в эфир по программам таджикского радио и телевидения;
тексты газет и информационных бюллетеней;
тексты журналов;
научные и научно-популярные тексты;
учебные тексты;
тексты официального, административного и юридического делопроизводства;
тексты известных таджикских толковых словарей и двуязычных словарей;
тексты бытового назначения (переписка, общения).
Тексты, размещаемые в корпус приводятся в объеме, соответствующем их доли в своде современных текстов.
Поскольку этот проект является общенациональным с благодарностью будут приняты все доброжелательные советы и предложения квалифицированных специалистов, которые будут способствовать улучшению работ по выполнению проекта. Для получения более подробной информации о ходе выполнения различных этапов проекта Вы можете обращаться в интернетсайты: cit.tj и termcom.tj