Що сам Goethe-Institut говорить про зворотний зв'язок ШІ
У 2025 році Goethe-Institut опублікував дослідження з однозначним заголовком: «AI Can't Cut It: Correcting Language Learners' Writing Still Has to Be Done by Teachers». У роботі порівнювали поширені інструменти ШІ з досвідченими викладачами на завданні коригування німецької мови учнів. Результат: на реальних учнівських текстах коригування ШІ було менш надійним, ніж учительське — особливо там, де коригування вимагає контексту, ідіоматичного чуття та усвідомлення критеріїв мовного іспиту.
Це важливе дослідження, і його часто розуміють хибно. Воно не каже, що ШІ марний для підготовки до іспиту. Воно каже, що ШІ сам по собі не дає надійного коригування. Це відкриває простір для моделі, яка ловить слабкості чистого ШІ людським шаром валідації.
У цьому посібнику показуємо, у чому помиляються чисті інструменти зворотного зв'язку ШІ на модулях Goethe-Zertifikat Schreiben, де вони справді допомагають, і чому надійна відповідь — гібридна модель. Ширше порівняння інструментів: інструменти ШІ за модулями Goethe.
Чотири офіційні критерії письма Goethe — і де ламається оцінювання ШІ
Eкзаменатори Goethe-Institut оцінюють кожне завдання Schreiben за тими самими чотирма критеріями: Aufgabenerfüllung, Kohärenz, Wortschatz, Strukturen. Інструмент ШІ, який не моделює явно цю четвірку, дає вам зворотний зв'язок з граматики — не з виконання іспиту.
Aufgabenerfüllung. Тут викладач перевіряє, чи покрито всі Leitpunkte, чи вибрано правильний тип тексту (Forumsbeitrag, Brief, Stellungnahme, Erörterung), і чи відповідають кількість слів і формат завданню. Загальні інструменти ШІ часто пропускають відсутній Leitpunkt.
Kohärenz. Як з'єднуються речення, як організовані абзаци, чи використовує текст Konnektoren функціонально чи декоративно? Загальний ШІ оцінює це поверхнево.
Wortschatz. Чи використовує текст словник на потрібному рівні? На B2 «добре» не достатньо — рубрика очікує конструкцій на кшталт «in Bezug auf», «im Hinblick darauf», «vor diesem Hintergrund».
Strukturen. Тут живуть найчастіші помилки ШІ. Вони стосуються порядку слів у підрядних реченнях, відокремлюваних дієслів, Konjunktiv II, вибору регістру та екзаменаційно-відповідних Konnektoren.
| Явище | Що ШІ часто робить | Що очікує іспит |
|---|---|---|
| Порядок слів у підрядному | приймає простіші головно-реченнєві конструкції | правильна кінцева позиція дієслова в dass-, weil-, obwohl-реченнях |
| Відокремлювані дієслова | непослідовне виправлення у складних структурах | правильне відокремлення у головному, без відокремлення у підрядному |
| Konjunktiv II | плутає з Indikativ у ввічливих формулюваннях | впевнене використання для ввічливості, гіпотези, непрямої мови |
| du/Sie регістр | непослідовне виправлення у текстах зі змішаним регістром | послідовний вибір відповідно до типу тексту |
| Konnektoren | «достатньо добре» з «und/aber/weil» | відповідні рівню Konnektoren: «infolgedessen», «demgegenüber», «vor diesem Hintergrund» |
| Ідіоматика | надмірне виправлення стилістично прийнятних формулювань | повага до ідіоматичних регістрових виборів |
Хто хоче тренувати поверхню Strukturen, повинен поєднати цю статтю з нашим посібником написання листів B1.
Де зворотний зв'язок ШІ справді переважає
ШІ не лише слабший. У трьох речах він вимірно випереджає викладача.
Швидкість ітерацій. Приватний викладач зазвичай повертає один виправлений текст за сесію. У 14-денному фіналі перед Goethe-Zertifikat B2 потрібно десять-двадцять виправлених чернеток. ШІ дає їх за хвилини.
Розпізнавання патернів. Після п'яти текстів хороший інструмент ШІ виявляє ваші повторювані типи помилок — наприклад «у 80 відсотках ваших текстів Konjunktiv II відсутній у ввічливих формулюваннях».
Доступність і вартість. Година приватного навчання у Німеччині коштує 25-50 євро. Сорок годин коригування за два місяці легко перевищують чотиризначний рахунок. ШІ доступний 24/7 за частку цієї суми.
Де викладачі залишаються незамінними
Люди мають сильні сторони, які ШІ не відтворює.
Прагматика і регістр. Лінія між формальним і напівформальним у німецькій тонка. Викладач одразу відчуває, коли «Sehr geehrte Frau Müller» опиняється у неправильному листі. ШІ часто не відчуває.
Стратегія та логіка іспиту. Яке з трьох B2-завдань Schreiben брати першим? Скільки часу на кожне? Де можна дозволити собі втратити бали без провалу? Це досвідне знання.
Мотивація та відповідальність. Викладач дивиться на вас. ШІ мовчить, поки ви не звернетеся.
Але: викладачі не можуть надати цикл ітерацій з десяти текстів на тиждень. Тут ламається чисто-викладацька модель.
Гібридна модель — для чого створено GoetheCoach
Надійна відповідь на «ШІ чи людина?»: обидва, з правильним поділом праці. GoetheCoach реалізує цю модель системно.
ШІ оцінює кожен практичний текст явно за чотирма офіційними критеріями: Aufgabenerfüllung (з перевіркою покриття Leitpunkte), Kohärenz, Wortschatz, Strukturen. Шар людської валідації переглядає місця, де ШІ сигналізує невпевненість.
| Джерело | узгодження підмета й присудка | відсутній Konjunktiv II | відсутній Leitpunkt | обґрунтування екзаменаційного рівня |
|---|---|---|---|---|
| загальний ChatGPT-промпт | іноді | рідко | ніколи | рідко |
| приватний викладач | так | так | так | так, але 48-годинне повернення |
| GoetheCoach (гібрид) | так | так | так | так, за хвилини |
Різниця не «людина краща за ШІ». Різниця — «гібридне коригування на основі критеріїв перемагає кожне з них окремо».
Як обрати модель зворотного зв'язку
Короткий посібник з рішень на тижні перед іспитом. Спільне у всіх трьох сценаріях: жодного DIY-prompting у загальному ШІ.
Чотири тижні або більше. Гібридний інструмент як основний канал плюс одна сесія з людиною на тиждень для стратегічних питань.
Два тижні або менше. Лише гібридний інструмент. Зосередьтеся на трьох найчастіших типах помилок.
Лише дні. Гібридний інструмент, один текст на день, без експериментів. Фокус на формат іспиту, покриття Leitpunkte і екзаменаційні Konnektoren.
Що означає зміна формату Goethe 2026
Модернізований Modellsatz 2026 від Goethe-Instituт надає більше ваги цифровому письму: коротші Forumsbeiträge, напівформальні листи. Ці типи мають менші обсяги, але вищі вимоги до узгодженості регістру та вірності Leitpunkte. Детально: іспит Goethe 2026: що змінилося.
Ключові висновки
- Чисте коригування ШІ ненадійне на Goethe-Zertifikat Schreiben — особливо щодо Aufgabenerfüllung, Kohärenz та рівневого Wortschatz.
- Чисте людське коригування точне, але надто дороге й надто повільне для фінальних ітерацій.
- Чотири офіційні критерії — Aufgabenerfüllung, Kohärenz, Wortschatz, Strukturen — єдина мірка, яка має значення.
- Гібридна модель — оцінювання ШІ плюс людська валідація — поєднує швидкість ітерацій із точністю.
- GoetheCoach — продукт, який системно операціоналізує цю модель.
Часті питання
ChatGPT може виявляти поверхневі граматичні помилки, але не оцінює за чотирма офіційними критеріями Goethe. Власне дослідження Goethe-Інституту 2025 року показало, що коригування ШІ менш надійне, ніж викладача.
Для глибини й стратегії — так. Для обсягу ітерацій — ні. Жоден викладач не виправить десять текстів на тиждень. Гібридна модель розв'язує дилему.
Aufgabenerfüllung (покриття Leitpunkte і вибір типу тексту), Kohärenz (логічний потік), Wortschatz (рівнева лексика), Strukturen (граматика, порядок слів). Кожен оцінюється незалежно.
Бо ви ніколи не впевнені, що ШІ виконав ваш промпт. Ви тренуєтеся на відповідях, правильність яких неможливо перевірити.
Щонайменше 15-20 для B2, щонайменше 20-30 для C1. Лише швидкість ітерацій ШІ робить цей обсяг реалістичним.
Ні. Оцінювання усвідомлює рівень: лексика B1 у тексті B2 позначається як слабкість, те саме слово у тексті A2 — нормально.
В офіційному Modellsatz Goethe-Instituт (goethe.de) та Prüfungsordnung.
Загальний ШІ зазвичай ігнорує. Інструмент на основі критеріїв позначає це як дефіцит Aufgabenerfüllung — саме там виграється або програється поріг 60 відсотків.
Тренуй письмо з гібридним ШІ-фідбеком
Оцінка за чотирма офіційними критеріями Goethe — ШІ оцінює, людина валідує.
Спробувати безкоштовно