Bezhta text corpus/Бежтинский корпус текстов – Zaira Khalilova (Makhachkala)

Bezhta text corpus

Zaira Khalilova
(Makhachkala)
Bezhta text corpus includes texts of various genres: fairy-tales, stories, biographies, dialogues, etc. There are about 65,000 tokens in the corpus, and the corpus lexicon includes about 4,000 lexical and morphological items. The most frequent tense-aspect verb forms in the corpus are the witnessed past and the present. Quite commonly, the Bezhta present corresponds to the Russian past tense. Also in Bezhta, the infinitive can head independent clauses, in particular in questions the infinitive corresponds to the Russian finite future.

Бежтинский корпус текстов

Халилова Заира
Махачкала
Бежтинский корпус текстов содержит тексты разных жанров: сказки, истории, биография, диалоги, и другие. Бежтинский корпус тексов содержит около 65000 знаков, а также словарь около 4000 слов и морфем. Наиболее часто в текстах встречаются такие временные формы как прошедшее заглазное и настоящее время. Очень часто настоящее время бежтинского языка в текстах соответствует прошедшему времени в русском языке. В бежтинском языке инфинитив может возглавлять финитное предложение, а именно, инфинитив в вопросительном предложении, который соответствует глаголу будущего времени русского языка.

Posted in Istanbul conference Abstracts.