On approval of the Rules for the formation and maintenance of the National Vocabulary Fund of the Kazakh language

Order of the Minister of Science and Higher Education of the Republic of Kazakhstan dated April 30, 2025 № 226. Registered with the Ministry of Justice of the Republic of Kazakhstan on May 6, 2025 № 36081

      Unofficial translation

      Pursuant to paragraph 4 of Article 24-4 of the Law of the Republic of Kazakhstan “On Culture”, and also subparagraph 160-2) of paragraph 15 of the Regulation on the Ministry of Science and Higher Education of the Republic of Kazakhstan, approved by Resolution of the Government of the Republic of Kazakhstan dated August 19, 2022 № 580, I hereby ORDER:

      1. Approve the attached Rules for the formation and maintenance of the National vocabulary fund of the Kazakh language.

      2. The Language Policy Committee of the Ministry of Science and Higher Education of the Republic of Kazakhstan shall ensure, in accordance with the procedure established by law:

      1) state registration of this order with the Ministry of Justice of the Republic of Kazakhstan;

      2) posting of this order on the official Internet resource of the Ministry of Science and Higher Education of the Republic of Kazakhstan.

      3. Control over the execution of this order shall be assigned to the supervising vice-minister of Science and Higher Education of the Republic of Kazakhstan.

      4. This order shall come into effect ten calendar days after the date of its first official publication.

      Minister of Science and Higher Education
of the Republic of Kazakhstan      S.Nurbek

      "AGREED"

      Ministry of Culture and Information

      of the Republic of Kazakhstan

      " AGREED "

      Ministry of Digital Development, Innovations
and Aerospace Industry
of the Republic of Kazakhstan

  Approved
  by the Order
  of the Minister of Science
  and Higher Education
of the Republic of Kazakhstan
dated April 30, 2025 №226

Rules for the formation and maintenance of the National vocabulary fund of the Kazakh language Chapter 1. General provisions

      1. The Rules for the formation and maintenance of the National vocabulary fund of the Kazakh language (hereinafter – The Rules) have been developed in pursuance of paragraph 4 of Article 24-4 of the Law of the Republic of Kazakhstan “On Culture” (hereinafter – the Law) subparagraph 160-2) of paragraph 15 of the Regulation on the Ministry of Science and Higher Education of the Republic of Kazakhstan, approved by the Resolution of the Government of the Republic of Kazakhstan dated August 19, 2022 № 580, and define the procedure for the formation and maintenance of the National vocabulary fund of the Kazakh language (hereinafter – the National vocabulary fund).

      2. The following basic concepts shall be used in the Rules:

      1) generation – the process of automatically creating new content (text, images, sound) based on data and pre-established rules;

      2) artificial intelligence models – the process of implementing artificial intelligence technologies and algorithms for processing data in the Kazakh language into various systems, applications or platforms;

      3) natural language processing – a machine learning technology that enables computers to understand, interpret and process human language.

      3. The objectives of the formation of the National vocabulary fund shall be preservation, protection and development of the Kazakh language as a cultural value, also enhancing the state language status, accumulation of resources covering all application areas of the Kazakh language, streamlining, digitization, generation of the current vocabulary stock of the language, its adaptation to artificial intelligence and modern technologies, automation of processing processes.

Chapter 2. Procedure for the formation of the National vocabulary fund of the Kazakh language

      4. Formation and maintenance of the National vocabulary fund shall be performed by a legal entity assigned by the authorized body in the language development, in accordance with paragraph 4, article 24-4, of the Law.

      5. Formation of the National vocabulary fund involves providing users of the system with access to functional and information services.

      6. The National vocabulary fund shall be formed on the basis of academic and translation dictionaries, the National Kazakh Language corpora, terminology base and a dataset, which is a set of data in various formats.

      7. The main objectives of the formation of the National vocabulary fund shall be:

      1) formation of a set of dictionaries enabling users to obtain comprehensive information about words;

      2) ensuring the placement, updating and dissemination of information about the norm of the Kazakh literary language;

      3) providing users with the opportunity of using electronic versions of verified dictionaries of various types;

      4) providing users with information on the dynamics of the development of the Kazakh literary language norm.

      8. Formation of the National vocabulary fund shall include:

      1) development of a step-by-step action plan on creation and development of the National vocabulary fund;

      2) approval of functional and technical requirements for the National vocabulary fund, a schedule for the provision of technical services and technical specifications of the information system designed to collect, process and systematize data;

      3) provision of an interactive user interface, a search engine and data export capability;

      4) coordination of actors in the field of creation and improvement of the National vocabulary fund;

      5) formation of the list of information resources capable of integration with the National vocabulary fund;

      6) use of open data platforms and ensuring compliance with state standards in the information technology and information security.

      9. When forming the National vocabulary fund, the legal entity determined by the authorized body in the language development shall be guided by the following principles:

      1) scientific validity, the need to rely on scientific research and factual data of all lexical units in the field of social-humanitarian and natural-mathematical sciences;

      2) systematicity, the need for complete and further improvement as a unique system;

      3) ensuring compliance with the norms of literary language;

      4) combination of traditions and innovation, the need for harmonious adaptation and introduction of new words and terms in accordance with the norm of the Kazakh language vocabulary and the modern requirements;

      5) accessibility and inclusiveness of all data for users of language resources.

      The National vocabulary fund formation shall factor in the public discussion of proposals concerning creation and improvement of this fund. Public discussion shall be conducted through open online platforms or public events with the possibility of proposals and comments from all interested parties. Independent experts in the socio-humanitarian and natural-mathematical sciences shall be involved in the formation and improvement of the National vocabulary fund.

Chapter 3. Procedure for maintenance of the National vocabulary fund

      10. Maintenance of the National vocabulary fund shall include:

      1) development of dictionaries database including meaning, etymology and patterns of common usage of words;

      2) creation of a centralized system of language corpora;

      3) improvement of the terminological base of the Kazakh language;

      4) development of technical requirements for collecting datasets including all application areas of the Kazakh language;

      5) provision of an accessible platform for scientific research;

      6) integration of artificial intelligence models, modern technologies in the Kazakh language;

      7) development of an interactive search system;

      8) collection, processing, storage of a database entered into the information system;

      9) availability of publicly available information in the open space of the Internet;

      10) information exchange of data between the information system actors;

      11) provision of text materials in digital format;

      12) provision of reliable and high-performance server programs;

      13) creation of relational and semantic links of language data;

      14) compliance with information security measures;

      15) work to update and improve the information system;

      16) measures to update the National vocabulary fund on its testing and approbation;

      17) development of a guide for self-study of the information system for users;

      18) ensuring activities for sorting and examining words, terms and phrases that correspond to the language norm, included in the National vocabulary fund;

      19) coordinating the activities of collegial actions carried out outside the system for the National Vocabulary Fund.

Об утверждении Правил формирования и ведения Национального словарного фонда казахского языка

Приказ Министра науки и высшего образования Республики Казахстан от 30 апреля 2025 года № 226. Зарегистрирован в Министерстве юстиции Республики Казахстан 6 мая 2025 года № 36081

      В соответствии с пунктом 4 статьи 24-4 Закона Республики Казахстан "О культуре", а также подпунктом 160-2) пункта 15 Положения о Министерстве науки и высшего образования Республики Казахстан, утвержденного постановлением Правительства Республики Казахстан от 19 августа 2022 года № 580, ПРИКАЗЫВАЮ:

      1. Утвердить прилагаемые Правила формирования и ведения Национального словарного фонда казахского языка.

      2. Комитету языковой политики Министерства науки и высшего образования Республики Казахстан в установленном законодательством порядке обеспечить:

      1) государственную регистрацию настоящего приказа в Министерстве юстиции Республики Казахстан;

      2) размещение настоящего приказа на официальном интернет-ресурсе Министерства науки и высшего образования Республики Казахстан.

      3. Контроль за исполнением настоящего приказа возложить на курирующего вице-министра науки и высшего образования Республики Казахстан.

      4. Настоящий приказ вводится в действие по истечении десяти календарных дней после дня его первого официального опубликования.

      Министр науки и высшего образования
Республики Казахстан
С. Нурбек

      "СОГЛАСОВАНО"

      Министерство культуры и информации

      Республики Казахстан

      "СОГЛАСОВАНО"

      Министерство цифрового развития,

      инноваций и аэрокосмической

      промышленности Республики Казахстан

  Утверждены приказом
Министр науки и
высшего образования
Республики Казахстан
от 30 апреля 2025 года
№ 226

Правила формирования и ведения Национального словарного фонда казахского языка

Глава 1. Общие положения

      1. Правила формирования и ведения Национального словарного фонда казахского языка (далее – Правила) разработаны в соответствии с пунктом 4 статьи 24-4 Закона Республики Казахстан "О культуре" (далее – Закон), подпунктом 160-2) пункта 15 Положения о Министерстве науки и высшего образования Республики Казахстан, утвержденного постановлением Правительства Республики Казахстан от 19 августа 2022 года № 580, и определяют порядок формирования и ведения Национального словарного фонда казахского языка (далее – Национальный словарный фонд).

      2. В настоящих Правилах используются следующие основные понятия:

      1) генерация – процесс автоматического создания нового контента (текста, изображения, звука) на основе данных и заранее установленных правил;

      2) модели искусственного интеллекта – процесс внедрения технологий и алгоритмов искусственного интеллекта для обработки данных на казахском языке в различные системы, приложения или платформы;

      3) обработка естественного языка – технология машинного обучения, которая дает компьютерам возможность понимать, интерпретировать и обрабатывать человеческий язык.

      3. Целями формирования Национального словарного фонда являются сохранение, защита и развитие казахского языка как культурной ценности, а также укрепление статуса государственного языка, накопление ресурсов, охватывающих все сферы применения казахского языка, упорядочение, цифровизация, генерация действующего лексического состава языка, адаптация его к искусственному интеллекту и современным технологиям, автоматизация процессов обработки.

Глава 2. Порядок формирования Национального словарного фонда

      4. Формирование и ведение Национального словарного фонда осуществляется юридическим лицом, определенным уполномоченным органом в области развития языков, в соответствии с пунктом 4 статьи 24-4 Закона.

      5. Формирование Национального словарного фонда предусматривает предоставление пользователям системы доступа к функциональным и информационным сервисам.

      6. Национальный словарный фонд формируется на основании академических и переводческих словарей, Национального корпуса казахского языка, терминологической базы и датасета, который является совокупностью данных различных форматов.

      7. Основными задачами формирования Национального словарного фонда являются:

      1) формирование совокупности словарей, позволяющих получить пользователям комплексные сведения о словах;

      2) обеспечение размещения, обновления и распространения информации о норме казахского литературного языка;

      3) предоставление пользователям возможности пользоваться электронными версиями верифицированных словарей различного типа;

      4) предоставление пользователям информации о динамике развития нормы казахского литературного языка.

      8. Формирование Национального словарного фонда включает:

      1) разработку поэтапного плана мероприятий по вопросам создания и развития Национального словарного фонда;

      2) утверждение функциональных и технических требований к Национальному словарному фонду, графика оказания технических услуг и технических спецификаций информационной системы, предназначенной для сбора, обработки и систематизации данных;

      3) обеспечение интерактивного пользовательского интерфейса, поисковой системы и возможности экспорта данных;

      4) координацию действий субъектов в области создания и совершенствования Национального словарного фонда;

      5) формирование списка информационных ресурсов, способных к интеграции с Национальным словарным фондом;

      6) использование платформ открытых данных и обеспечение соответствия государственным стандартам в области информационных технологий и информационной безопасности.

      9. При формировании Национального словарного фонда юридическое лицо, определенное уполномоченным органом в области развития языков, руководствуется следующими принципами:

      1) научная обоснованность, необходимость опираться на научные исследования и фактические данные всех лексических единиц в области общественно-гуманитарных и естественно-математических наук;

      2) систематичность, необходимость полного и дальнейшего совершенствования как уникальной системы;

      3) обеспечение соблюдения нормы литературного языка;

      4) сочетание традиций и новаторства, необходимость гармоничной адаптации и введения новых слов и терминов в соответствии с нормой лексики казахского языка и требованиями современности;

      5) доступность и инклюзивность всех данных для пользователей языковых ресурсов.

      Формирование Национального словарного фонда осуществляется с учетом публичного обсуждения предложений, касающихся создания и совершенствования данного фонда. Публичное обсуждение проводится через открытые онлайн-платформы или публичные мероприятия с возможностью внесения предложений и комментариев от всех заинтересованных сторон. К формированию и совершенствованию Национального словарного фонда привлекаются независимые эксперты в области общественно-гуманитарных и естественно-математических наук.

Глава 3. Порядок ведения Национального словарного фонда

      10. Ведение Национального словарного фонда включает:

      1) разработку базы словарей, включающих значение, этимологию и модели общего употребления слов;

      2) создание централизованной системы языковых корпусов;

      3) совершенствование терминологической базы казахского языка;

      4) разработку технических требований для сбора датасетов, включающих все сферы применения казахского языка;

      5) предоставление доступной платформы для научных исследований;

      6) интеграцию моделей искусственного интеллекта, современных технологий на казахском языке;

      7) разработку интерактивной поисковой системы;

      8) осуществление сбора, обработки, хранения базы данных, вносимых в информационную систему;

      9) наличие общедоступной информации в открытом пространстве Интернета;

      10) информационный обмен данными между субъектами информационной системы;

      11) предоставление текстовых материалов в цифровом формате;

      12) обеспечение надежными и высокопроизводительными серверными программами;

      13) создание реляционных и семантических связей языковых данных;

      14) соблюдение мер информационной безопасности;

      15) проведение работы по обновлению и совершенствованию информационной системы;

      16) принятие мер по актуализации Национального словарного фонда по его тестированию и апробации;

      17) разработку руководства для самостоятельного обучения информационной системы для пользователей;

      18) обеспечение деятельности по сортировке и экспертизе слов, терминов и словосочетаний, соответствующих языковой норме, включаемых в Национальный словарный фонд;

      19) координацию деятельности коллегиальных действий, осуществляемых вне системы по Национальному словарному фонду.