W niniejszej analizie pokazuję, jak ogromną różnorodnością cechują się szkoły podstawowe, jeśli podsumować je wynikami egzaminu ósmoklasisty z matematyki. Analizuję rok 2025, ale praktycznie identyczne wnioski można wyciągnąć na podstawie poprzednich lat.
Jako podsumowanie danej szkoły przyjmuję medianę uzyskanych w niej wyników egzaminu. Można ją interpretować jako “przeciętny wynik szkoły” (lub jak kto woli: wynik przeciętnego ucznia). Jeśli taka mediana wynosi np. 30%, połowa uczniów w takiej szkole uzyskała mniej niż 30% punktów, połowa więcej.
Biorę pod uwagę tylko szkoły, w których zdawało co najmniej 10 uczniów. To niewiele, natomiast – i to pierwsza ważna informacja – w 25% szkół w całej Polsce do egzaminu przystąpiło mniej niż 10 uczniów (a w 55% mniej niż 20). Trzeba pamiętać, że w takich małych grupach jest większa szansa uzyskania ekstremalnych wartości (bardzo niska lub wysoka mediana). Nie chcę jednak odrzucać takich szkół, bo nie uzyskamy wtedy pełnego obrazu (odpadnie bardzo dużo szkół np. na wsiach lub w mniejszych miejscowościach).
Oprócz tego pominąłem szkoły specjalne, integracyjne, dla dorosłych oraz Szkołę w Chmurze (tę ostatnią z kilku powodów, między innymi dlatego, że nie da się określić, skąd pochodzą zapisani do niej uczniowie — a w tej analizie będzie to ważny czynnik). Biorę pod uwagę szkoły publiczne i niepubliczne, choć w niektórych miejscach będę ograniczał się tylko do tych pierwszych.
Rozrzut przeciętności
Na poniższym wykresie rozkład median dla szkół z języka polskiego. W większości szkół przeciętny wynik znalazł się w przedziale 50-80%, z czego mniej więcej połowa w przedziale 60-70%.
Rozkład jest dość wąski, czego należało się spodziewać, bo nie analizujemy pełnego rozkładu wyników (dla każdego ucznia), ale już podsumowanie dla szkół. Mimo to, rozkład wyników z matematyki jest zupełnie inny, o bardzo dużym rozrzucie:
W niektórych szkołach mediana wynosi 20% (czyli połowa uczniów napisała jeszcze gorzej), w innych 80%. Dodam, że ponieważ połowę punktów można było otrzymać za zadania zamknięte z czterema odpowiedziami (jedna poprawna), to strzelając w tej części i nie rozwiązując żadnego zadania otwartego otrzymamy średnio 12,5%.
Można przypuszczać, że za te najwyższe mediany odpowiadają np. szkoły w największych miastach, a za najniższe w najmniejszych – i jeśli ograniczymy się do jednego miasta, ten rozrzut median nie będzie tak duży. Tak jednak nie jest. Poniżej wyniki dla Łodzi, Poznania i Wrocławia.
Czyli w jednym mieście mamy pełny przekrój szkół. Jeszcze raz podkreślę, że to nie są wyniki uczniów (wtedy nie byłoby to zaskakujące), ale przeciętne dla szkół.
W przypadku języka polskiego wygląda to zupełnie inaczej.
Duże i małe miasta
Porównam teraz wyniki w miastach powyżej 500 tys. mieszkańców (Warszawa, Kraków, Łódź, Wrocław, Poznań), poniżej 100 tys. oraz na wsi (gmina wiejska lub obszar wiejski w gminie miejsko-wiejskiej), ale ograniczając się tylko do szkół publicznych. Do miast 100-500 tys. odniosę się później.
Zamiast histogramów (które byłyby nieczytelne w takich porównaniach) prezentuję wykresy gęstości (ważone liczbą zdających). Jeśli Czytelnik nie zna tego rodzaju wykresu, to można na niego spojrzeć jak na “wygładzony” histogram, dodatkowo skalowany tak, że pole pod wykresem (dla każdej grupy) jest takie samo. Z tego powodu każda z grup zajmuje tyle samo miejsca, mimo że szkół w największych miast jest mniej (ok. 5% wszystkich, choć stanowi to 9% uczniów piszących egzamin, bo są to zwykle większe szkoły). Wartości na osi Y w takich wykresach nie mają żadnej praktycznej interpretacji (są skalowane tak, by pole pod wykresem dla każdej grupy wynosiło 1), dlatego ich nie pokazuję. Dodatkowo wyniki na krańcach osi X nie są interpretowalne, w szczególności nie ma żadnej szkoły z medianą 100% (jest to “artefakt” wykresu gęstości).
Jak widać na wykresie, rozkłady dla szkół na wsiach i w miastach poniżej 100 tys. mieszkańców praktycznie pokrywają się, natomiast w największych miastach wyniki są kompletnie inne.
Szkoły niepubliczne
A czy są szkoły w miastach poniżej 100 tys. mieszkańców o wynikach zbliżonych do tych z największych miast? Tak: szkoły niepubliczne. Medianę co najmniej 70% uzyskano w 47% szkół niepublicznych, a jedynie w 6% szkół publicznych.
Oczywiście szkół niepublicznych jest znacznie mniej: 13%, a liczba zdających egzamin w takich szkołach to ok. 5% (w miastach poniżej 100 tys. mieszkańców). Oprócz tego z tego wykresu NIE WYNIKA, że poziom nauczana w szkołach niepublicznych jest wyższych. Do niełatwej interpretacji tych danych przejdę w dalszej części.
Poniżej wyniki dla grup, które pominąłem wyżej.
Wyniki dla miast 100-500 tys. znajdują się “pomiędzy” największymi i najmniejszymi miastach, choć ich rozkład jest bardzo szeroki, czyli znajdziemy zarówno szkoły z wynikami lepszymi od tych z największych miast, jak i gorszymi od tych z najmniejszych (i nie będą to wyjątki).
Poniżej podział na szkoły publiczne i niepubliczne dla wszystkich kategorii miast.
Lepsze wyniki w szkołach niepublicznych są niezależne od wielkości miasta. W największych jest parę szkół z niższymi wynikami, są to między innymi szkoły sportowe.
W poprzednich latach też tak było
Taka sytuacja to nie jest wyjątek akurat w tym roku. Poniżej te same wykresy dla egzaminu z matematyki z lat 2021-25.
Interpretacja
Spróbujmy teraz powiedzieć, co z tych wykresów wynika, a co nie. Nie ma wątpliwości, że wyniki w największych miastach oraz w szkołach niepublicznych są znacznie lepsze. Natomiast czy jest tak dlatego, że poziom nauczenia jest tam wyższy, to zupełnie osobna sprawa. Jeśli to nie jest jasne, polecam Czytelnikowi artykuł o korelacji i przyczynowości (akurat w kontekście wyników egzaminu ósmoklasisty).
Ponieważ uczniowie w największych miastach różnią się od tych z mniejszych miast już zanim zaczną chodzić do takiej szkoły, to część z obserwowanych różnic między szkołami można wytłumaczyć właśnie tymi wstępnymi różnicami (w dalszej części pokażę, że kluczową cechą może być wykształcenie rodziców). Podobnie, do szkół niepublicznych nie chodzi reprezentatywny dla całej Polski podzbiór uczniów, ale mamy do czynienia z silną selekcją.
Z drugiej strony, poza poziomem szkoły (kadry nauczycielskiej) istotny jest poziom, jaki średnio reprezentują uczniowie w szkole/klasie. To po pierwsze ułatwia naukę, po drugie przyciąga coraz lepszych nauczycieli. W takim razie można się spodziewać, że jednak za część tych różnic albo już teraz odpowiada szkoła, albo będzie tak w przyszłości. Osobiście interpretuję te wykresy jako pokazujące pewien trend: prognozę, jak może wyglądać edukacja za parę lat.
Spróbuję teraz uzasadnić, dlaczego taka prosta interpretacja tych zależności jest niepoprawna i pokazać, jak duże znacznie ma wykształcenie rodziców.
Matura 2025 vs. egzamin ósmoklasisty 2021
Na poniższym wykresie zestawiłem średni wynik egzaminu ósmoklasisty z 2021 roku (oś X) ze średnim wynikiem matury z 2025 roku (oś Y) w danym mieście. Tym razem analizuję średnie, nie mediany, bo mają lepsze własności przy podsumowaniu wyników z wielu szkół (średnia z całego miasta). Rozmiar punktu jest proporcjonalny do liczby zdających. Wziąłem akurat takie lata, bo uczniowie zdający egzamin ósmoklasisty w 2021 to mniej więcej te same osoby, który zdawały maturę w 2025 (oczywiście jest to przybliżenie, w szczególności część uczniów mogła pisać maturę w innymi mieście; oprócz tego w przypadku techników należałoby wziąć wyniki z 2020 roku).
Korelacja jest bardzo duża (0,87), czyli średni wyniki egzaminu ósmoklasisty w danym mieście jest bardzo podobny do średniego wyniki matury. A mówimy tu przecież o zupełnie innych szkołach (podstawowe i licea/technika). Gdyby za wyniki uczniów odpowiadała głównie szkoła, korelacja między nimi powinna być znacznie niższa.
Na kolejnym wykresie korelacja między procentem mieszkańców z wykształceniem wyższym a średnim wynikiem egzaminu ósmoklasisty w danym mieście.
To nie jest przypadek, że wykres wygląda bardzo podobnie do poprzedniego: na podstawie wykształcenia jesteśmy w stanie z dobrą dokładnością przewidzieć średni wynik egzaminu.
Oczywiście trzeba być tu ostrożnym z wnioskami, bo nie analizujemy wyników uczniów, w szczególności nie mamy informacji o wykształceniu ich rodziców, ale zbiorcze wyniki dla całego miasta (i swoją drogą, większe znaczenie może mieć właśnie “wykształcenie miasta”, a nie konkretnych rodziców). Oprócz tego takie przeciętne wykształcenie jest wypadkową wielu innych efektów i każdy z nich może mieć znaczenie.
Na koniec spróbuję skorygować początkowy wykres z korelacją między wynikami egzaminu a wielkością miasta, uwzględniając przeciętne wykształcenie w danym mieście/gminie. Technicznie można to wykonać, modelując relację między medianą wyników egzaminu a wykształceniem (użyłem regresji liniowej, bo relacja jest w przybliżeniu liniowa), a następnie zestawić reszty z takiego modelu z wielkością miasta (do reszt dodaję średni wynik egzaminu, żeby zachować pierwotną skalę).
Rozkłady są teraz znacznie bliżej siebie. Innymi słowy, tę ogromną różnicę na pierwotnym wykresie da się w dużej mierze “wyjaśnić” przeciętnym wykształceniem w gminie.
Dodam, że ta korekta nie wpływa na różnice w wynikach między szkołami publicznymi i niepublicznymi. Tutaj potrzebne byłyby już indywidualne dane o wykształceniu.
Zależności z wykształceniem i wieloma innymi cechami zostały zbadanie znacznie obszerniej w tej analizie (wyniki egzaminu ósmoklasisty z lat 2021-24). Co ciekawe, po uwzględnieniu wykształcenia przestaje mieć znaczenie np. mediana wynagrodzeń w gminie.
Źródła
Obliczenia wykonałem w języku R i jeśli ktoś chciałby je powtórzyć, udostępniam kod.
