On approval of the Rules for the formation and maintenance of the National Vocabulary Fund of the Kazakh language

Order of the Minister of Science and Higher Education of the Republic of Kazakhstan dated April 30, 2025 № 226. Registered with the Ministry of Justice of the Republic of Kazakhstan on May 6, 2025 № 36081

      Unofficial translation

      Pursuant to paragraph 4 of Article 24-4 of the Law of the Republic of Kazakhstan “On Culture”, and also subparagraph 160-2) of paragraph 15 of the Regulation on the Ministry of Science and Higher Education of the Republic of Kazakhstan, approved by Resolution of the Government of the Republic of Kazakhstan dated August 19, 2022 № 580, I hereby ORDER:

      1. Approve the attached Rules for the formation and maintenance of the National vocabulary fund of the Kazakh language.

      2. The Language Policy Committee of the Ministry of Science and Higher Education of the Republic of Kazakhstan shall ensure, in accordance with the procedure established by law:

      1) state registration of this order with the Ministry of Justice of the Republic of Kazakhstan;

      2) posting of this order on the official Internet resource of the Ministry of Science and Higher Education of the Republic of Kazakhstan.

      3. Control over the execution of this order shall be assigned to the supervising vice-minister of Science and Higher Education of the Republic of Kazakhstan.

      4. This order shall come into effect ten calendar days after the date of its first official publication.

      Minister of Science and Higher Education
of the Republic of Kazakhstan      S.Nurbek

      "AGREED"

      Ministry of Culture and Information

      of the Republic of Kazakhstan

      " AGREED "

      Ministry of Digital Development, Innovations
and Aerospace Industry
of the Republic of Kazakhstan

  Approved
  by the Order
  of the Minister of Science
  and Higher Education
of the Republic of Kazakhstan
dated April 30, 2025 №226

Rules for the formation and maintenance of the National vocabulary fund of the Kazakh language Chapter 1. General provisions

      1. The Rules for the formation and maintenance of the National vocabulary fund of the Kazakh language (hereinafter – The Rules) have been developed in pursuance of paragraph 4 of Article 24-4 of the Law of the Republic of Kazakhstan “On Culture” (hereinafter – the Law) subparagraph 160-2) of paragraph 15 of the Regulation on the Ministry of Science and Higher Education of the Republic of Kazakhstan, approved by the Resolution of the Government of the Republic of Kazakhstan dated August 19, 2022 № 580, and define the procedure for the formation and maintenance of the National vocabulary fund of the Kazakh language (hereinafter – the National vocabulary fund).

      2. The following basic concepts shall be used in the Rules:

      1) generation – the process of automatically creating new content (text, images, sound) based on data and pre-established rules;

      2) artificial intelligence models – the process of implementing artificial intelligence technologies and algorithms for processing data in the Kazakh language into various systems, applications or platforms;

      3) natural language processing – a machine learning technology that enables computers to understand, interpret and process human language.

      3. The objectives of the formation of the National vocabulary fund shall be preservation, protection and development of the Kazakh language as a cultural value, also enhancing the state language status, accumulation of resources covering all application areas of the Kazakh language, streamlining, digitization, generation of the current vocabulary stock of the language, its adaptation to artificial intelligence and modern technologies, automation of processing processes.

Chapter 2. Procedure for the formation of the National vocabulary fund of the Kazakh language

      4. Formation and maintenance of the National vocabulary fund shall be performed by a legal entity assigned by the authorized body in the language development, in accordance with paragraph 4, article 24-4, of the Law.

      5. Formation of the National vocabulary fund involves providing users of the system with access to functional and information services.

      6. The National vocabulary fund shall be formed on the basis of academic and translation dictionaries, the National Kazakh Language corpora, terminology base and a dataset, which is a set of data in various formats.

      7. The main objectives of the formation of the National vocabulary fund shall be:

      1) formation of a set of dictionaries enabling users to obtain comprehensive information about words;

      2) ensuring the placement, updating and dissemination of information about the norm of the Kazakh literary language;

      3) providing users with the opportunity of using electronic versions of verified dictionaries of various types;

      4) providing users with information on the dynamics of the development of the Kazakh literary language norm.

      8. Formation of the National vocabulary fund shall include:

      1) development of a step-by-step action plan on creation and development of the National vocabulary fund;

      2) approval of functional and technical requirements for the National vocabulary fund, a schedule for the provision of technical services and technical specifications of the information system designed to collect, process and systematize data;

      3) provision of an interactive user interface, a search engine and data export capability;

      4) coordination of actors in the field of creation and improvement of the National vocabulary fund;

      5) formation of the list of information resources capable of integration with the National vocabulary fund;

      6) use of open data platforms and ensuring compliance with state standards in the information technology and information security.

      9. When forming the National vocabulary fund, the legal entity determined by the authorized body in the language development shall be guided by the following principles:

      1) scientific validity, the need to rely on scientific research and factual data of all lexical units in the field of social-humanitarian and natural-mathematical sciences;

      2) systematicity, the need for complete and further improvement as a unique system;

      3) ensuring compliance with the norms of literary language;

      4) combination of traditions and innovation, the need for harmonious adaptation and introduction of new words and terms in accordance with the norm of the Kazakh language vocabulary and the modern requirements;

      5) accessibility and inclusiveness of all data for users of language resources.

      The National vocabulary fund formation shall factor in the public discussion of proposals concerning creation and improvement of this fund. Public discussion shall be conducted through open online platforms or public events with the possibility of proposals and comments from all interested parties. Independent experts in the socio-humanitarian and natural-mathematical sciences shall be involved in the formation and improvement of the National vocabulary fund.

Chapter 3. Procedure for maintenance of the National vocabulary fund

      10. Maintenance of the National vocabulary fund shall include:

      1) development of dictionaries database including meaning, etymology and patterns of common usage of words;

      2) creation of a centralized system of language corpora;

      3) improvement of the terminological base of the Kazakh language;

      4) development of technical requirements for collecting datasets including all application areas of the Kazakh language;

      5) provision of an accessible platform for scientific research;

      6) integration of artificial intelligence models, modern technologies in the Kazakh language;

      7) development of an interactive search system;

      8) collection, processing, storage of a database entered into the information system;

      9) availability of publicly available information in the open space of the Internet;

      10) information exchange of data between the information system actors;

      11) provision of text materials in digital format;

      12) provision of reliable and high-performance server programs;

      13) creation of relational and semantic links of language data;

      14) compliance with information security measures;

      15) work to update and improve the information system;

      16) measures to update the National vocabulary fund on its testing and approbation;

      17) development of a guide for self-study of the information system for users;

      18) ensuring activities for sorting and examining words, terms and phrases that correspond to the language norm, included in the National vocabulary fund;

      19) coordinating the activities of collegial actions carried out outside the system for the National Vocabulary Fund.

Қазақ тілінің ұлттық сөздік қорын қалыптастыру және жүргізу қағидаларын бекіту туралы

Қазақстан Республикасы Ғылым және жоғары білім министрінің 2025 жылғы 30 сәуірдегі № 226 бұйрығы. Қазақстан Республикасының Әділет министрлігінде 2025 жылғы 6 мамырда № 36081 болып тіркелді

      "Мәдениет туралы" Қазақстан Республикасы Заңының 24-4-бабы 4-тармағына, сондай-ақ Қазақстан Республикасы Үкіметінің 2022 жылғы 19 тамыздағы № 580 қаулысымен бекітілген Қазақстан Республикасы Ғылым және жоғары білім министрлігі туралы ереженің 15-тармағының 160-2) тармақшасына сәйкес БҰЙЫРАМЫН:

      1. Қоса беріліп отырған Қазақ тілінің ұлттық сөздік қорын қалыптастыру және жүргізу қағидалары бекітілсін.

      2. Қазақстан Республикасы Ғылым және жоғары білім министрлігінің Тіл саясаты комитеті заңнамада белгіленген тәртіппен:

      1) осы бұйрықтың Қазақстан Республикасы Әділет министрлігінде мемлекеттік тіркелуін;

      2) осы бұйрықты Қазақстан Республикасы Ғылым және жоғары білім министрлігінің ресми интернет-ресурсына орналастыруды қамтамасыз етсін.

      3. Осы бұйрықтың орындалуын бақылау жетекшілік ететін Қазақстан Республикасы Ғылым және жоғары білім вице-министріне жүктелсін.

      4. Осы бұйрық алғашқы ресми жарияланған күнінен кейін күнтізбелік он күн өткен соң қолданысқа енгізіледі.

      Қазақстан Республикасының
Ғылым және жоғары білім министрі
С. Нурбек

      "КЕЛІСІЛДІ"

      Қазақстан Республикасы

      Мәдениет және ақпарат министрлігі

      "КЕЛІСІЛДІ"

      Қазақстан Республикасы

      Цифрлық даму, инновациялар және

      аэроғарыш өнеркәсібі министрлігі

  Қазақстан Республикасының
Ғылым және жоғары білім
министрі
2025 жылғы 30 сәуірдегі
№ 226 Бұйрығымен
бекітілген

Қазақ тілінің ұлттық сөздік қорын қалыптастыру және жүргізу қағидалары

1-тарау. Жалпы ережелер

      1. Қазақ тілінің ұлттық сөздік қорын қалыптастыру және жүргізу қағидалары (бұдан әрі – Қағидалар) "Мәдениет туралы" Қазақстан Республикасы Заңының (бұдан әрі – Заң) 24-4-бабы 4-тармағына, Қазақстан Республикасы Үкіметінің 2022 жылғы 19 тамыздағы № 580 қаулысымен бекітілген Қазақстан Республикасы Ғылым және жоғары білім министрлігі туралы ереженің 15-тармағының 160-2) тармақшасына сәйкес әзірленді және Қазақ тілінің ұлттық сөздік қорын (бұдан әрі – Ұлттық сөздік қор) қалыптастыру мен жүргізу тәртібін айқындайды.

      2. Осы Қағидаларда мынадай негізгі ұғымдар пайдаланылады:

      1) генерация – деректер мен алдын ала белгіленген ережелер негізінде жаңа контентті (мәтін, сурет, дыбыс) автоматты түрде құру процесі;

      2) жасанды интеллект модельдері – қазақ тіліндегі деректерді өңдеуге арналған жасанды интеллект технологияларын және алгоритмдерін әртүрлі жүйелерге, қосымшаларға немесе платформаларға енгізу процесі;

      3) табиғи тілді өңдеу – компьютерлерге адам тілін түсінуге, түсіндіруге және өңдеуге мүмкіндік беретін машиналық оқыту технологиясы.

      3. Ұлттық сөздік қорды құрудың мақсаты қазақ тілін мәдени құндылық ретінде сақтау, қорғау және дамыту, сондай-ақ мемлекеттік тіл мәртебесін нығайту, қазақ тілінің барлық қолданыс аясын қамтитын ресурстарды жинақтау, тілдің қолданыстағы лексикалық құрамын ретке келтіру, цифрландыру, генерациялау, оны жасанды интеллект пен заманауи технологияларға бейімдеу, өңдеу процестерін автоматтандыру болып табылады.

2-тарау. Ұлттық сөздік қорды қалыптастыру тәртібі

      4. Заңның 24-4-бабының 4-тармағына сәйкес Ұлттық сөздік қорды қалыптастыруды және жүргізуді тілдерді дамыту саласындағы уәкілетті орган айқындаған заңды тұлға іске асырады.

      5. Ұлттық сөздік қорды қалыптастыру жүйені пайдаланушыларға функционалдық және ақпараттық сервистерге қолжетімділік беруді көздейді.

      6. Ұлттық сөздік қор академиялық және аударма сөздіктер, Қазақ тілінің ұлттық корпусы, терминологиялық база және түрлі форматтағы мәліметтер жиынтығы болып табылатын датасет негізінде қалыптастырылады.

      7. Ұлттық сөздік қорды қалыптастырудың негізгі міндеттері:

      1) пайдаланушыларға сөздер туралы кешенді мәліметтер алуға мүмкіндік беретін сөздіктер жиынтығын қалыптастыру;

      2) қазақ әдеби тілінің нормасы туралы ақпаратты орналастыруды, жаңартуды және таратуды қамтамасыз ету;

      3) пайдаланушыларға түрлі сипаттағы тексерілген сөздіктердің электрондық нұсқасын қолдануға мүмкіндік беру;

      4) пайдаланушыларға қазақ әдеби тілі нормасының даму динамикасы туралы ақпарат ұсыну.

      8. Ұлттық сөздік қорды қалыптастыру:

      1) Ұлттық сөздік қорды құру және дамыту мәселелері жөнінде кезеңдік іс-шаралар жоспарын әзірлеуді;

      2) Ұлттық сөздік қорға қойылатын функционалдық және техникалық талаптарды, техникалық қызмет көрсету кестесін және деректерді жинақтауға, өңдеуге, жүйелеуге арналған ақпараттық сипаттамаларды бекітуді;

      3) интерактивті пайдаланушының интерфейсін, іздеу жүйесін және деректерді экспорттау мүмкіндігін қамтамасыз етуді;

      4) Ұлттық сөздік қорды құру және жетілдіру саласындағы субъектілердің іс-қимылын үйлестіруді;

      5) Ұлттық сөздік қормен интеграциялануға қабілетті ақпараттық ресурстардың тізбесін қалыптастыруды;

      6) ашық деректер платформаларын пайдалануды және ақпараттық технологиялар мен ақпараттық қауіпсіздік саласындағы мемлекеттік стандарттарға сәйкес келуін қамтамасыз етуді қамтиды.

      9. Ұлттық сөздік қорды қалыптастыру кезінде тілдерді дамыту саласындағы уәкілетті орган айқындаған заңды тұлға:

      1) ғылыми негізділік, қоғамдық-гуманитарлық және жаратылыстану-математикалық ғылымдар саласындағы барлық лексикалық бірліктердің ғылыми зерттеулер мен нақты деректерге негізделу қажеттілігі;

      2) жүйелілік, бірегей жүйе ретінде толық және әрі қарай жетілдірілу қажеттілігі;

      3) әдеби тіл нормасын сақтауды қамтамасыз ету;

      4) дәстүр мен жаңашылдықты үйлестіру, қазақ тілінің лексикалық нормасы мен қазіргі заман талаптарына сәйкес жаңа сөздер мен терминдерді үйлесімді түрде бейімдеу, енгізу қажеттілігі;

      5) барлық деректердің тілдік ресурстарды пайдаланушылар үшін қолжетімділігі және инклюзивтілігі принциптерін басшылыққа алады.

      Ұлттық сөздік қорды қалыптастыру аталған қорды құруға және жетілдіруге қатысты ұсыныстарды жария талқылауды ескере отырып жүзеге асырылады. Қоғамдық талқылау барлық мүдделі тараптардың ұсыныстары мен түсініктемелерін енгізу мүмкіндігімен ашық онлайн платформалар немесе қоғамдық іс-шаралар арқылы жүзеге асырылады. Ұлттық сөздік қорды қалыптастыруға және жетілдіруге қоғамдық-гуманитарлық және жаратылыстану-математикалық ғылымдар саласындағы тәуелсіз сарапшылар тартылады.

3-тарау. Ұлттық сөздік қорды жүргізу тәртібі

      10. Ұлттық сөздік қорды жүргізу:

      1) сөздердің мағынасын, этимологиясын және жалпы қолдану үлгілерін қамтитын сөздіктер базасын әзірлеуді;

      2) тіл корпустарының орталықтандырылған жүйесін құруды;

      3) қазақ тілінің терминологиялық базасын жетілдіруді;

      4) қазақ тілін қолданудың барлық саласын қамтитын датасет жинауға арналған техникалық талаптарды әзірлеуді;

      5) ғылыми зерттеулер үшін қолжетімді платформа ұсынуды;

      6) қазақ тіліндегі жасанды интеллект модельдерін, заманауи технологияларды интеграциялауды;

      7) интерактивті іздеу жүйесін әзірлеуді;

      8) ақпараттық жүйеге енгізілетін деректер қорын жинауды, өңдеуді, сақтауды жүзеге асыруды;

      9) жалпыға қолжетімді ақпараттың Интернеттің ашық кеңістігінде болуын;

      10) ақпараттық жүйенің субъектілері арасында мәліметтермен ақпараттық алмасуды;

      11) мәтіндік материалдарды цифрлық форматта беруді;

      12) сенімді және жоғары өнімді бағдарламалармен қамтамасыз етілуді;

      13) тілдік деректердің реляциялық және семантикалық байланыстарын құруды;

      14) ақпараттық қауіпсіздік шараларын сақтауды;

      15) ақпараттық жүйені жаңарту және жетілдіру бойынша жұмыс жүргізуді;

      16) Ұлттық сөздік қорды өзектендіруде оны тестілеу және сынақтан өткізу бойынша шаралардың қабылдануын;

      17) пайдаланушылар үшін ақпараттық жүйені өздігінен оқуға арналған нұсқаулықтың әзірленуін;

      18) Ұлттық сөздік қорға енгізілетін тіл нормасына сәйкес келетін сөздерді, терминдер мен сөз тіркестерін сұрыптау және сараптау қызметін қамтамасыз етуді;

      19) Ұлттық сөздік қор бойынша жүйеден тыс жүзеге асырылатын алқалы әрекеттер қызметін үйлестіруді қамтиды.