Kodowanie otwarte, osiowe, selektywne: jak to działa w analizie treści

0
9
Rate this post

Nawigacja po artykule:

Po co w ogóle kodować? Cel i miejsce kodowania w analizie treści

Kodowanie jako most między surowym materiałem a wnioskami

Kodowanie w analizie treści jest technicznym, ale kluczowym etapem: łączy surowy materiał (posty, artykuły, raporty, komentarze, nagrania, zdjęcia, filmy) z finalnymi wnioskami badawczymi. Samo czytanie lub oglądanie materiału, nawet uważne, rzadko wystarczy do zbudowania przejrzystej, replikowalnej argumentacji. Kodowanie tworzy strukturalny „log” tego, co zostało zauważone, nazwane i jak to potem zostało zsyntetyzowane.

Przypisując fragmentom materiału kody (etykiety), tworzysz warstwę pośrednią: zamiast setek stron tekstu masz zestaw kategorii i relacji między nimi. Z tą warstwą można dalej pracować: liczyć wystąpienia, porównywać grupy, śledzić zmiany w czasie, budować modele przyczynowo-skutkowe. To kodowanie sprawia, że interpretacje nie są tylko „wrażeniem badacza”, ale efektem uporządkowanego procesu, który można opisać i – przynajmniej częściowo – powtórzyć.

Podświetlanie ciekawych fragmentów vs systematyczne kodowanie

W praktyce badań jakościowych często pojawia się etap „podkreślania ciekawych fragmentów”. To intuicyjny początek, ale nie zastępuje systematycznego kodowania. Różnicę dobrze widać w sposobie pracy:

  • podświetlanie: „tu ktoś mówi o strachu”, „tu ładna metafora”, „tu reklama jest agresywna”; brak jednoznacznych nazw i zasad, co dokładnie uznajemy za „strach” czy „agresję”;
  • kodowanie: każdy fragment oznaczasz konkretną etykietą, np. strach przed utratą pracy, agresywny ton marki, metafora walki, z jasną decyzją, dlaczego przypisujesz właśnie ten kod.

Podświetlanie zatrzymuje się na poziomie intuicji. Kodowanie wymusza precyzyjne decyzje interpretacyjne: co jest istotną treścią, jak ją nazwać, jak odróżnić od innych zjawisk. Dzięki temu można potem sprawdzić spójność kodowania (np. między różnymi osobami kodującymi) i prześledzić, jak krok po kroku powstawały kategorie.

Relacja kodowania do analizy treści, dyskursu i narracji

Kodowanie otwarte, osiowe i selektywne pochodzi z tradycji teorii ugruntowanej, ale mechanizm dobrze nadaje się także do:

  • klasycznej analizy treści – gdy interesuje cię, co jest obecne w materiale i z jaką częstością (np. ile razy w artykułach pojawia się temat „bezpieczeństwa danych”);
  • analizy dyskursu – gdy analizujesz, jak jest mówione/pisane: jakie są strategie językowe, jak pozycjonowane są grupy społeczne, kto ma prawo głosu;
  • analizy narracyjnej – gdy śledzisz przebieg opowieści, bohaterów, wątki i punkty zwrotne.

Różnią się pytania badawcze i poziom interpretacji, ale łączy je jedno: trzeba zapanować nad chaosem materiału. Kodowanie jest tym etapem, na którym definiujesz, jakie elementy (tematy, strategie, sceny, role) uznajesz za ważne i jak je będziesz śledzić w całym zbiorze danych.

Kodowanie w logice całego projektu badawczego

Kodowanie nie jest celem samym w sobie. Jest częścią szerszego pipeline’u:

  1. Pytania badawcze – czego chcesz się dowiedzieć o treściach lub komunikacji? (np. „Jak marki fintech mówią o bezpieczeństwie?”).
  2. Dobór materiału – jakie teksty, posty, materiały wideo, dokumenty analizujesz; w jakim okresie, z jakich źródeł.
  3. Kodowanie – otwarte (rozbijanie materiału), osiowe (porządkowanie i łączenie), selektywne (wybór wątków centralnych).
  4. Analiza i interpretacja – budujesz model, narrację, porównania między grupami, wnioski praktyczne.
  5. Raportowanie – pokazujesz, jak z surowego materiału, przez kody, doszedłeś do tych konkretnych wniosków.

Bez kodowania trudno jasno pokazać ten „łańcuch przetwarzania” danych. Dla klienta, promotora czy innego badacza to właśnie schemat kodowania i kategorie są dowodem, że wnioski nie są przypadkowym zbiorem obserwacji.

Ilościowe vs jakościowe podejście do kodowania

Kodowanie pojawia się zarówno w podejściu ilościowym, jak i jakościowym, ale mechanizm i cel różnią się istotnie.

AspektKodowanie ilościoweKodowanie jakościowe (otwarte/osiowe/selektywne)
Cel głównyZliczanie tego, co z góry zdefiniowaneOdkrywanie struktur znaczeń i relacji
Źródło kodówPrzeważnie dedukcyjne (zdefiniowana kategoryzacja)Przeważnie indukcyjne lub mieszane
Elastyczność siatki kodówNiska – kategorie ustalone przed analiząWysoka – siatka zmienia się w toku analizy
Jednostka analizyPrzeważnie prosta (np. zdanie, artykuł)Często złożona (motywy, wątki, praktyki dyskursywne)
RezultatTabele, statystyki, wskaźnikiModele, narracje, typologie, teorie ugruntowane

Kodowanie otwarte, osiowe i selektywne należy do jakościowej strony spektrum. Nie wyklucza liczenia (np. ile razy pojawia się dany motyw), ale jego głównym zadaniem jest zrozumienie struktury znaczeń, a nie tylko policzenie częstotliwości.

Zbliżenie na kartę z czerwonym wykresem i ołówkami do analizy danych
Źródło: Pexels | Autor: RDNE Stock project

Podstawy: czym jest kod i kategoria w analizie treści

Co to jest kod, kategoria i konstrukty analityczne

Kod to krótka etykieta przypisana do fragmentu materiału, który uznałeś za znaczący wobec swoich pytań badawczych. Dobrze skonstruowany kod:

  • jest zwięzły, ale konkretny (np. strach przed oceną, a nie tylko strach);
  • od razu sugeruje, co wydarza się w tym fragmencie (np. obwinianie instytucji);
  • pozwala odróżnić ten fragment od innych – jeśli dwa kody znaczą prawie to samo, system jest zbyt rozmyty.

Kategoria (czasem nazywana konstruktem) to zbiór powiązanych kodów. Kategoria ma wyższy poziom ogólności. Na przykład kategoria poczucie zagrożenia może zawierać kody:

  • strach przed utratą pracy,
  • obawa przed oceną w social media,
  • niepewność finansowa.

Kategoria nie jest tylko techniczną „szufladą”. To pojęcie analityczne, którym będziesz operować w interpretacji i raporcie. Im lepiej przemyślisz relacje między kodami w obrębie kategorii, tym bardziej spójny i przekonujący będzie końcowy model.

Jednostka analizy i jednostka kontekstu

Kod przypisujesz zawsze do jakiejś jednostki analizy – może to być:

  • zdanie lub jego część,
  • akapit,
  • pojedynczy post, komentarz, mem, tweet,
  • kadr w wideo, scena, ujęcie.

Obok tego jest jednostka kontekstu – szerszy fragment, potrzebny do sensownej interpretacji. Przykład: kodujesz zdanie z artykułu jako oskarżanie rządu, ale musisz znać cały akapit lub tekst, aby ocenić, czy to rzeczywiście oskarżenie, czy ironia lub cytat. Jednostka analizy to to, co kodujesz; jednostka kontekstu to to, co czytasz, aby zrozumieć fragment.

Sensowne zdefiniowanie jednostki analizy na starcie ułatwia spójne kodowanie – zarówno w projekcie, który robisz sam, jak i w większym zespole badawczym. Zbyt małe jednostki (każde słowo) generują chaos, zbyt duże (cały artykuł) – gubią szczegóły.

Kody opisowe vs interpretacyjne

Kody można podzielić na:

  • opisowe – mówią, co dosłownie jest powiedziane/pokazane (np. wzmianka o bezpieczeństwie danych, użycie metafory wojny, wypowiedź eksperta);
  • interpretacyjne – mówią, co to znaczy w kontekście badania (np. budowanie autorytetu marki, eskalowanie poczucia zagrożenia, pozycjonowanie klienta jako ofiary).

Na etapie kodowania otwartego dobrze jest łączyć oba typy: najpierw wychwycić „gołe” działania i obiekty (opisowe), a następnie – tam, gdzie to potrzebne – dodać kody interpretacyjne. Dalsze etapy (osiowe, selektywne) operują zwykle przewagą kodów interpretacyjnych, bo to one budują twoją narrację badawczą.

Źródła kodów: indukcyjne, dedukcyjne, mieszane

Kody mogą mieć różne źródła:

  • Indukcyjne – wyłaniają się z materiału. Czytasz/oglądasz i nazwiesz zjawisko, którego wcześniej nie miałeś w słowniku (np. „uśmiechnięta katastrofa” w komunikacji klimatycznej).
  • Dedukcyjne – pochodzą z teorii, literatury, hipotez lub briefu klienta. Przykład: masz z góry założone, że interesują cię kody związane z poczuciem kontroli, bo to kluczowy konstrukt w badaniach nad stresem.
  • Mieszane – startujesz z krótką listą kodów dedukcyjnych (szkielet), ale

systematycznie dopisujesz nowe kody indukcyjnie, gdy w materiale pojawia się coś istotnego, czego wstępny schemat kodowania nie obejmuje. W praktyce badań jakościowych mieszana strategia jest najczęstsza i najpraktyczniejsza.

Skalibrowanie poziomu szczegółowości kodów

Klasyczny problem: kody są albo za szerokie, albo za szczegółowe.

  • Za szerokie kody: np. „emocje”, „problemy”, „korzyści”. Po kilku godzinach kodowania połowa materiału jest oznaczona jako „problem”, a ty niewiele z tego wiesz.
  • Za szczegółowe kody: np. „strach przed utratą pracy w branży IT po 40. roku życia”, „złość na aplikację bankową działającą w sobotę z opóźnieniem”. To zbyt małe różnice, aby zbudować sensowną kategorię.

Praktyczna wskazówka: dobry kod jest wystarczająco precyzyjny, aby coś odróżnić, ale na tyle ogólny, aby pojawić się w wielu miejscach. Jeśli po przejrzeniu kilku materiałów widzisz, że używasz kodu tylko raz – rozważ, czy to naprawdę kod, czy raczej notatka/memo do szczególnego przypadku.

Kodowanie otwarte: rozbijanie materiału na sensowne elementy

Sens kodowania otwartego: rozszczepianie i nazywanie

Kodowanie otwarte to pierwszy, najbardziej „rozdrabniający” etap pracy. Chodzi o to, aby rozbić materiał na małe, ale znaczące kawałki i nazwać to, co się w nich dzieje. Nie filtrujesz jeszcze danych pod główną tezę, nie wybierasz najważniejszych kategorii – tworzysz możliwie bogaty „słownik zjawisk” występujących w materiale.

Kluczowa zasada: na tym etapie lepiej trochę przesadzić z liczbą kodów niż coś przegapić. Nadmiar uporządkujesz w kodowaniu osiowym. Zbyt wczesne cięcie i uproszczenie zrobią dziury, których później nie nadrobisz.

Strategie segmentowania: linijka, segment semantyczny, akt komunikacyjny

Zanim zaczniesz kodować otwarcie, ustal, jak będziesz dzielić materiał. Trzy popularne strategie:

  • Linijka po linijce – dosłownie przechodzisz linia po linii (w wywiadach, transkrypcjach, długich wpisach). Dobra metoda, gdy materiał jest gęsty, a chcesz uniknąć przeskakiwania „na skróty”.
  • Segment semantyczny i akt komunikacyjny w praktyce

    Segment semantyczny to fragment, który „trzyma się znaczeniowo razem” – jedno twierdzenie, jedna mini-historia, jeden argument. Może to być jedno zdanie, ale równie dobrze pół akapitu. Wybierasz go wtedy, gdy:

  • respondent rozwija jedną myśl przez kilka zdań,
  • post składa się z kilku linijek, ale wszystkie służą temu samemu celowi (np. wyjaśnienie, jak działa produkt),
  • w artykule masz sekwencję: teza + przykład + doprecyzowanie.

Akt komunikacyjny (act of communication) to fragment wyodrębniony ze względu na funkcję: prośba, skarga, żart, autopromocja, podziękowanie, atak. Sprawdza się np. w analizie komentarzy, forów, social mediów, gdzie to, po co ktoś coś mówi, jest równie ważne jak treść.

Przykład: komentarz pod reklamą może zawierać jednocześnie ironię, skargę i próbę zbudowania wspólnoty („ktoś jeszcze miał taki problem?”). Możesz wtedy:

  • potraktować cały komentarz jako jedną jednostkę analizy, ale zastosować kilka kodów, albo
  • rozbić komentarz na akty: ironiczny wstęp, właściwą skargę, zaproszenie innych do rozmowy.

Tip: w projektach nastawionych na procesy komunikacyjne (np. moderacja dyskusji online) lepiej działa podejście aktami komunikacyjnymi. W klasycznym badaniu opinii spokojnie wystarczy segment semantyczny.

Jak faktycznie kodować linijka po linijce

Tryb „linijka po linijce” jest męczący, ale bardzo oczyszczający. Procedura krok po kroku:

  1. Czytasz pierwszą linijkę i pytasz: „co tu się dzieje?” (jak w mikro-analizie działań, nie: „co ktoś ogólnie myśli o świecie”).
  2. Formułujesz 1–2 krótkie kody, które opisują to działanie/stan/znaczenie.
  3. Idziesz do kolejnej linijki i nie zakładasz, że kody będą takie same – jeśli pasują, używasz ich, jeśli nie, tworzysz nowe.
  4. Po kilku stronach zaczynasz widzieć powtarzalne wzory – wtedy możesz zacząć używać konsekwentnie tych samych kodów dla tych samych typów zjawisk.

Uwaga: nie sprowadzaj tego procesu do „podkreślania słów kluczowych”. Kodujesz zjawiska, nie tylko słownictwo. Fragment: „No tak, znowu to samo, nikt nas nie słucha” może dostać kody poczucie zignorowania i powtarzalność problemów, nawet jeśli słowo „ignorowanie” nie pada.

Fuzja kodów opisowych i interpretacyjnych w otwartym etapie

Na starcie system kodów bywa chaotyczny: trochę opisów literalnych, trochę wstępnych interpretacji, trochę „roboczych etykiet”, które trzeba będzie przeredagować. Z technicznego punktu widzenia dobra praktyka to:

  • oznaczać w narzędziu (kolorem, sufiksem) kody opisowe vs interpretacyjne,
  • na koniec pierwszego przebiegu zrobić szybki przegląd listy kodów i uporządkować je: poprawić nazwy, połączyć oczywiste duplikaty, wyrzucić ewidentne notatki.

To nie jest jeszcze kodowanie osiowe, ale mini-refaktoryzacja. Tak jak w programowaniu – lepiej nie zostawiać brzydkich nazw zmiennych na później, bo po tygodniu nie pamiętasz, co znaczyło kod_23.

Memoing: notatki przy kodowaniu otwartym

Z kodowaniem otwartym powinna iść systematyczna praca z memo (krótkimi notatkami badawczymi). Typowe mema na tym etapie:

  • „Ten kod pojawia się głównie u osób po 30., może to kwestia etapu życia?”
  • „Tu respondenci używają żartu, kiedy mówią o lęku – sprawdzić, czy to wzór.”
  • „Czy bezradność wobec technologii nie jest częścią szerszej kategorii utrata kontroli?”

Takie mema są później paliwem dla kodowania osiowego. Bez nich łatwo zgubić pierwsze intuicje, gdy siatka kodów urośnie do kilkuset pozycji.

Dłoń analizująca wykresy biznesowe na drewnianym biurku
Źródło: Pexels | Autor: Lukas Blazek

Kodowanie osiowe: porządkowanie, łączenie i budowanie struktury

Przejście od „listy kodów” do systemu kategorii

Po kodowaniu otwartym zostajesz z długim, różnorodnym zbiorem kodów. Kodowanie osiowe (axial coding) to etap, w którym:

  • ustalasz, które kody ze sobą „chodzą”,
  • budujesz kategorie wyższego rzędu,
  • wyłaniasz wstępne relacje: przyczyna–skutek, warunki–konsekwencje, kontekst–strategie działania.

Zmienia się też perspektywa: zamiast pytać tylko „co tu się dzieje?”, zaczynasz pytać „jak to się łączy z innymi rzeczami, które widzę?”.

Powiązania między kodami: typowe relacje osiowe

Przy łączeniu kodów przydaje się kilka prostych typów relacji. Ułatwiają decyzję, co z czym scalać:

  • Relacja część–całość – kilka kodów opisuje warianty tego samego zjawiska (np. strach przed utratą pracy, lęk przed kompromitacją w sieci, obawa o zdrowie dzieci) i składa się na kategorię poczucie zagrożenia.
  • Relacja sekwencyjna – kody opisują kolejne kroki procesu (np. uświadomienie problemuszukanie informacjipodjęcie działaniarezygnacja).
  • Relacja przyczynowo-skutkowa (w sensie analitycznym, nie statystycznym) – np. negatywne doświadczenie z obsługąbrak zaufania do markiunikanie kontaktu.
  • Relacja kontrastowa – kody reprezentują przeciwstawne strategie lub pozycje (np. zrzucanie winy na instytucje vs branie odpowiedzialności indywidualnej).

Na poziomie narzędziowym oznacza to często grupowanie kodów w „rodziny” lub „drzewa”, ale sednem jest logika relacji, a nie sam fakt, że coś wylądowało pod jednym folderem.

Oś analityczna: wokół czego budujesz porządek

Samo „szufladkowanie” kodów to za mało. W kodowaniu osiowym chodzi też o zidentyfikowanie osi analitycznych – wymiarów, według których można uporządkować zjawiska. Przykładowe osie:

  • czas (przed – w trakcie – po doświadczeniu),
  • intensywność (słabe – średnie – silne poczucie zagrożenia),
  • poziom kontroli (poczucie sprawstwa – poczucie bezradności),
  • pozycja podmiotu (ofiara – ekspert – obserwator),
  • kanał komunikacji (bezpośrednia rozmowa – e-mail – social media).

Taka oś działa jak układ współrzędnych: możesz zobaczyć, gdzie lokują się poszczególne kategorie i czy tworzą skupiska (np. „wysoki lęk + niskie poczucie kontroli + komunikacja wyłącznie online”).

Budowanie kategorii: kryteria dobrego „kontenera”

Kategoria na etapie osiowym powinna spełniać kilka warunków:

  • Spójność semantyczna – wszystkie kody w środku odnoszą się do podobnego zjawiska, a nie są „śmietnikiem” resztek.
  • Użyteczność analityczna – kategoria pomaga odpowiedzieć na pytania badawcze lub prowadzi do nowego, sensownego pytania.
  • Rozróżnialność – da się wyjaśnić, czym ta kategoria różni się od sąsiednich.

Jeśli tworzysz kategorię „inne praktyki” lub „inne emocje” – to zwykle sygnał, że albo pytanie badawcze jest za szerokie, albo część kodów wymaga jeszcze przemyślenia i przeniesienia do lepiej nazwanych kategorii.

Model paradygmatyczny (kontekst – warunki – działania – konsekwencje)

W ugruntowanej teorii (grounded theory) klasycznym narzędziem kodowania osiowego jest model paradygmatyczny – sposób mapowania zjawisk w czterech krokach:

  1. Kontekst – w jakiej sytuacji coś się dzieje? (np. praca zdalna, pandemia, presja czasu).
  2. Warunki przyczynowe – co „uruchamia” zjawisko? (np. zła komunikacja przełożonego, brak jasnych procedur).
  3. Działania/strategie – co robią aktorzy w odpowiedzi? (np. unikanie kontaktu, szukanie wsparcia wśród kolegów, pasywna agresja).
  4. Konsekwencje – co z tego wynika? (np. wypalenie, rotacja pracowników, normalizacja konfliktów).

Ten szkielet pomaga przekształcić rozproszone kody w opowieści o procesach – jak coś się rozwija od punktu A do Z. Nie trzeba go stosować dogmatycznie, ale bywa świetnym „debuggerem” modelu: jeśli nie wiesz, które kody są warunkami, a które konsekwencjami, to znaczy, że relacje są jeszcze zbyt luźne.

Iteracje między kodowaniem otwartym i osiowym

W praktyce rzadko wygląda to tak, że najpierw całkowicie kończysz kodowanie otwarte, a potem „przełączasz się” na osiowe. Częstszy scenariusz:

  • kodujesz otwarcie pierwszy pakiet materiałów,
  • robisz pierwsze grupowanie kodów, tworzysz wstępne kategorie,
  • w kolejnym pakiecie kodujesz już zarówno otwarcie (nowe zjawiska), jak i osiowo (dopasowujesz do istniejących kategorii lub je modyfikujesz).

Ten ruch tam–z powrotem jest normalny. Część kodów „spada” w trakcie – tracą znaczenie, gdy model się krystalizuje. Nie ma obowiązku utrzymywania wszystkich etykiet tylko dlatego, że kiedyś je stworzyłeś.

Dokumentowanie decyzji: mini-raport struktury kodów

Dobrą praktyką po fazie osiowej jest spisanie krótkiego opisu systemu kategorii:

  • lista głównych kategorii z krótkimi definicjami,
  • wyliczenie najważniejszych kodów podrzędnych z przykładami cytatów,
  • opis kluczowych relacji (np. które kategorie są poprzednikami innych).

To rodzaj „specyfikacji technicznej” twojego modelu. Ułatwia dalsze kodowanie, szczególnie w zespole, i chroni przed dryfem znaczeń (ten sam kod używany przez dwie osoby w zupełnie innym sensie).

Dwie laborantki w ochronnych fartuchach badają próbki przy mikroskopie
Źródło: Pexels | Autor: www.kaboompics.com

Kodowanie selektywne: wyłanianie „historii”, modelu lub głównego wątku

Po co etap selektywny: od mapy do trajektorii

Po kodowaniu osiowym masz już mapę: kategorie, relacje, osie analityczne. Kodowanie selektywne (selective coding) to etap, w którym:

  • wybierasz główne wątki – nie wszystko jest równie ważne,
  • integrujesz rozproszone relacje w spójny model lub „historię” zjawiska,
  • odrzucasz lub spychasz na dalszy plan to, co nie wnosi kluczowej wartości do odpowiedzi na pytania badawcze.

Można powiedzieć, że na tym etapie przestajesz być „archiwistą danych”, a stajesz się projektantem modelu.

Kategoria centralna (core category) i jej rola

Klasyczny element kodowania selektywnego to kategoria centralna – pojęcie, wokół którego organizują się inne. Nie zawsze musi być jedna, ale często da się wskazać takie „jądro”, np.:

  • odzyskiwanie poczucia kontroli,
  • negocjowanie tożsamości eksperta,
  • normalizowanie ryzyka,
  • oswajanie technologii.

Kategoria centralna spełnia kilka funkcji:

  • jest najbardziej nasycona danymi (pojawia się często, w różnych kontekstach),
  • łączy wątki pozornie odległe (np. emocje, praktyki, narracje),
  • jest na tyle abstrakcyjna, że można ją zastosować do wielu przypadków, ale nadal „przyklejona do danych”.

Dobrym testem na kategorię centralną jest pytanie: „jeśli miałbym w jednym zdaniu opowiedzieć, o czym jest ten materiał, to jakiego pojęcia użyję?”.

Selekcja: co zostaje w modelu, a co ląduje na marginesie

Filtrowanie kodów: kryteria „wejścia” do modelu

Na etapie selektywnym nie chodzi jeszcze o pisanie wniosków, tylko o filtrowanie struktury, którą zbudowałeś osiowo. Przydają się proste kryteria, według których decydujesz, co zostaje w „silniku” modelu:

  • Znaczenie dla pytania badawczego – jeśli dana kategoria nie pomaga odpowiedzieć na główne pytania (ani ich sensownie przekształcić), trafia na margines.
  • Stopień nasycenia – kategorie oparte na pojedynczych, słabo udokumentowanych przypadkach lepiej trzymać w rezerwie, a nie w rdzeniu.
  • Spójność z kategorią centralną – kluczowe elementy modelu powinny być z nią w wyraźnej relacji (warunek, strategia, konsekwencja, kontekst lub przeciwstawny biegun).
  • Stabilność definicji – jeśli definicja kategorii ciągle się rozjeżdża przy kolejnym fragmencie danych, trudno oprzeć na niej centralny wątek.

Kody i kategorie, które przegrywają ten „casting”, nie idą do kosza. Tworzą obszar peryferyjny – zjawiska ważne, ale drugoplanowe: tło, wyjątki, lokalne warianty.

Spójność narracyjna: jak sprawdzić, czy model „trzyma się kupy”

Po wstępnej selekcji przychodzi test spójności. Można go zrobić jak przegląd techniczny:

  • Test ścieżki – da się prześledzić typową trajektorię: od warunków, przez działania, do konsekwencji, bez skakania po luźnych wątkach?
  • Test luki – czy w którymś miejscu „opowieść” się urywa (np. nie wiadomo, co łączy warunki z działaniami)?
  • Test redundancji – czy jakieś kategorie robią de facto to samo (inny label, ta sama funkcja w modelu)?

Dobrą praktyką jest naszkicowanie modelu na kartce albo w prostym diagramie (np. pudełka i strzałki). Czysto wizualne „debugowanie” często ujawnia zduplikowane lub zbędne elementy.

Przykład selekcji: co wypada z rdzenia

Załóżmy, że analizujesz wywiady o adaptacji do pracy zdalnej. W kodowaniu osiowym masz m.in. kategorie:

  • organizacja przestrzeni domowej,
  • przeciążenie informacyjne,
  • negocjowanie granic z domownikami,
  • eksperymenty z narzędziami online,
  • nowe rytuały dnia (np. spacer „zamiast” dojazdu).

Jeśli kategorią centralną staje się odzyskiwanie poczucia kontroli, może się okazać, że:

  • organizacja przestrzeni, negocjowanie granic i eksperymenty z narzędziami wchodzą do rdzenia jako strategie odzyskiwania kontroli,
  • przeciążenie informacyjne pełni rolę kluczowego warunku (powód, dla którego ludzie szukają kontroli),
  • nowe rytuały dnia stają się elementem peryferyjnym – ciekawym, ale niekoniecznym do zrozumienia głównego wątku.

Uwaga: peryferyjne nie znaczy „nieistotne życiowo”. To tylko decyzja, co jest potrzebne do wyjaśnienia badanego zjawiska, a nie ocena ważności dla uczestników.

Integracja: składanie fragmentów w model konceptualny

Po odsianiu nadmiaru przychodzi etap integracji: łączysz kategorie w model konceptualny (mentalny „schemat działania” zjawiska). Zazwyczaj obejmuje on:

  • kategorię centralną (rdzeń procesu lub główne napięcie),
  • zestaw głównych warunków, które ten proces wyzwalają lub wzmacniają,
  • główne strategie/działania aktorów,
  • kluczowe konsekwencje (wymiar indywidualny, organizacyjny, społeczny),
  • istotne osie różnicujące (np. wiek, staż, typ instytucji), które modyfikują przebieg procesu.

Technicznie ten etap często przypomina dopracowywanie architektury systemu: przesuwasz „moduły”, scalasz bloki o podobnej funkcji, upraszczasz ścieżki przepływu (zbyt skomplikowany model zwykle oznacza, że kody są jeszcze zbyt przywiązane do surowej treści).

Weryfikacja w danych: kodowanie selektywne jako re-kodowanie

Kodowanie selektywne nie sprowadza się do myślenia „nad stołem”. To też powrót do danych z nowym filtrem. Typowy workflow:

  1. Definiujesz kategorię centralną i główne wątki.
  2. Opracowujesz krótkie definicje robocze (co należy, co nie należy do danej kategorii).
  3. Przechodzisz ponownie przez materiał, szczególnie miejsca graniczne – tam, gdzie nie byłeś pewien kodowania.
  4. Sprawdzasz, czy nowa architektura „łapie” większość istotnych fragmentów bez rozciągania znaczeń na siłę.

Tip: przy takim re-kodowaniu dobrze włączyć tryb „comparative” – porównywać fragmenty zakodowane jako ta sama kategoria i pytać, czy rzeczywiście mówią o tym samym procesie.

Operacjonalizacja modelu: przejście od kodów do twierdzeń

Selektywne kodowanie wygasza moment „ciągłego odkrywania” i przełącza tryb pracy na formułowanie twierdzeń (claims). Dane nie znikają, ale zaczynają służyć jako testy dla hipotez wyprowadzonych z modelu. Przykładowe kroki:

  • zamiana relacji osiowych na twierdzenia typu „jeśli – to” (np. „jeśli pracownicy mają niski wpływ na organizację pracy, to częściej opisują strategie unikania niż konfrontacji”),
  • wskazanie warunków brzegowych – kiedy model „przestaje działać” (np. wyjątki, grupy odstające),
  • określenie poziomu ogólności – czy model opisuje raczej dany zespół, typ organizacji, czy szersze zjawisko społeczne.

Na tym etapie analiza treści zaczyna produkować coś bardziej systematycznego niż zbiór ciekawych cytatów – zestaw reguł lub mechanizmów, które można komunikować innym badaczom.

Kodowanie w analizie treści, dyskursu i narracji: podobieństwa i różnice

Różne cele, różne „wrażliwości” kodowania

To samo narzędzie – kodowanie – pracuje inaczej w zależności od tradycji badawczej. W dużym uproszczeniu:

  • Analiza treści skupia się na tym, co jest mówione/pisane (tematy, wątki, argumenty, emocje).
  • Analiza dyskursu interesuje się tym, jak jest mówione (sposoby konstruowania znaczeń, pozycji, władzy, „oczywistości”).
  • Analiza narracji patrzy na opowieści jako formę (strukturę historii, role bohaterów, punkty zwrotne, trajektorie).

To przekłada się na inny styl kodowania, nawet jeśli formalnie korzystasz z tych samych narzędzi (np. NVivo, MAXQDA, Atlas.ti).

Kodowanie w analizie treści: „co, ile, w jakim kontekście”

W klasycznej analizie treści kody są najczęściej:

  • tematyczne (o czym jest fragment),
  • funkcjonalne (jaką pełni funkcję w tekście – np. przykład, argument, kontrargument, ilustracja),
  • afektywne (jakie emocje są wyrażane lub implikowane),
  • deskryptorowe (metadata: kto mówi, kiedy, w jakim medium).

Zestaw ten pozwala zarówno na analizę jakościową (modelowanie procesów), jak i – po odpowiedniej agregacji – półilościowe porównania (częstość, współwystępowanie kategorii).

Kodowanie w analizie dyskursu: figury, pozycje, reżimy mówienia

W analizie dyskursu mniej interesuje „częstość”, bardziej reguły wytwarzania znaczeń. Typowe typy kodów:

  • repertuary interpretacyjne (typowe sposoby mówienia o czymś, np. „rynek jako naturalna selekcja”, „państwo jako rodzic”),
  • pozycjonowania podmiotów (kto jest przedstawiany jako ekspert, ofiara, winny, „normalny”),
  • kategorie graniczne (słowa i metafory wyznaczające, co jest „wewnątrz” i „na zewnątrz” normalności),
  • praktyki językowe (np. tryb rozkazujący, uogólnienia typu „wszyscy wiedzą, że…”, odwołania do „zdrowego rozsądku”).

Kodowanie otwarte w takim podejściu często wychwytuje powtarzające się metafory i schematy, kodowanie osiowe – porządkuje je w większe formacje dyskursywne (np. „dyskurs odpowiedzialności indywidualnej”), a selektywne – wybiera te formacje, które są kluczowe dla badanych sporów czy relacji władzy.

Kodowanie w analizie narracji: struktura opowieści i role

W analizie narracyjnej jednostką podstawową nie jest „wypowiedź”, tylko historia (ciąg zdarzeń, który ma początek, rozwinięcie, punkt zwrotny, rozwiązanie). To zmienia optykę kodowania:

  • kody odnoszą się do segmentów narracji (ekspozycja, kryzys, zwrot, wynik),
  • pojawiają się kody ról narracyjnych (bohater, przeciwnik, sojusznik, świadek),
  • istotne są kody schematów fabularnych (np. „upadek i odkupienie”, „walka z systemem”, „powolne dojrzewanie do zmiany”).

Kodowanie osiowe bywa tu bardziej „czasowe” niż „tematyczne”: układasz sekwencje zdarzeń, sprawdzasz powracające trajektorie (np. wielokrotne próby zmiany pracy, które zawsze kończą się tak samo). Selektywne kodowanie wybiera dominujące wzory narracyjne, a nie tylko pojedyncze tematy.

Stopień formalizacji: od luźnych notatek do słowników kodów

Analiza treści – zwłaszcza w projektach mieszanych (mixed methods) – bywa najmocniej sformalizowana. Często buduje się:

  • słownik kodów (codebook) z definicjami, przykładami i regułami decyzji,
  • procedury kontroli zgodności międzykoderowej (intercoder reliability),
  • precyzyjne instrukcje dotyczące jednostek kodowania (zdanie, akapit, cała odpowiedź).

W analizie dyskursu i narracji dopuszcza się zwykle większą elastyczność – w zamian za głębszą, bardziej kontekstową interpretację. Zamiast mocno zdefiniowanych kodów pojawiają się czasem „pakiety wrażliwości analitycznej” (np. lista zjawisk, na które badacz ma zwracać uwagę).

Kodowanie a poziom uogólnienia: od case study do teorii

Różnice w kodowaniu mają też związek z ambicją uogólnienia:

  • w analizie treści kody i kategorie często są projektowane tak, by dało się je zastosować do wielu przypadków (raporty, wywiady, posty w social media),
  • w analizie dyskursu ważniejsza jest rekonstrukcja konkretnej konfiguracji historyczno-politycznej; kody mogą być bardziej specyficzne dla danego dyskursu,
  • w analizie narracji chodzi często o typy historii (np. „narracje o migracji powrotnej”), które nie zawsze przekładają się na „liczalne” kategorie.

Mimo tych różnic mechanika trzech etapów – otwartego, osiowego, selektywnego – pozostaje przydatna. Zmienia się raczej to, co uznajesz za sensowną jednostkę i oś porządkowania, niż samo narzędzie.

Łączenie perspektyw: kiedy analiza treści, dyskursu i narracji współistnieją

W praktycznych projektach granice między podejściami często się rozmywają. Przykładowy scenariusz:

  • wywiady biograficzne z osobami po wypaleniu zawodowym,
  • kodowanie otwarte i osiowe w duchu analizy treści – tematy, strategie radzenia sobie, czynniki organizacyjne,
  • dodatkowe kody narracyjne – struktura historii (kiedy pojawia się „punkt pęknięcia”, jak opisywana jest zmiana),
  • refleks dyskursywny – jak rozmówcy przejmują język „produktu”, „efektywności” czy „rynku” do opisu własnego zdrowia.

Najczęściej zadawane pytania (FAQ)

Po co w ogóle robić kodowanie w analizie treści?

Kodowanie tworzy pomost między surowym materiałem (teksty, posty, nagrania, obrazy) a wnioskami badawczymi. Zamiast bazować na „ogólnym wrażeniu”, budujesz uporządkowany zapis tego, co zauważyłeś, jak to nazwałeś i jak potem to zsyntetyzowałeś.

Dzięki kodowaniu możesz:

  • porównywać fragmenty między sobą i między grupami,
  • liczyć wystąpienia motywów lub strategii komunikacyjnych,
  • odtworzyć ścieżkę: od fragmentu materiału → przez kod → do kategorii i wniosków.

To właśnie schemat kodów i kategorii jest dowodem, że wnioski nie są przypadkowym zbiorem obserwacji.

Na czym polega kodowanie otwarte, osiowe i selektywne?

Kodowanie otwarte to pierwszy etap, w którym „rozbijasz” materiał na mniejsze fragmenty i nadajesz im możliwie precyzyjne etykiety (kody). Tu pojawia się dużo nowych, często jeszcze nieuporządkowanych kodów – chodzi o wychwycenie tego, co się dzieje w danych, bez zbyt sztywnej siatki z góry.

Kodowanie osiowe polega na porządkowaniu tego chaosu: łączysz powiązane kody w kategorie, określasz relacje (np. przyczyna–skutek, warunek–rezultat, część–całość). Kodowanie selektywne to wybór wątków centralnych – kilku kluczowych kategorii, wokół których budujesz główny model, narrację lub teorię ugruntowaną.

Czym różni się podkreślanie fragmentów od systematycznego kodowania?

Podkreślanie to intuicyjne zaznaczanie „ciekawych” miejsc: fragmentów o silnych emocjach, ładnych metaforach czy mocnych opiniach. Nie definiujesz jednak precyzyjnie, co dokładnie kwalifikuje fragment jako „strach” czy „agresję”, nie ma też jasnych zasad, jak traktować podobne przypadki.

W systematycznym kodowaniu każdy fragment oznaczasz konkretną, opisową lub interpretacyjną etykietą, np. „strach przed utratą pracy”, „agresywny ton marki”, „metafora walki”. Do tego dochodzi świadoma decyzja: dlaczego ten kod, a nie inny. Dzięki temu można sprawdzić spójność kodowania (np. między dwoma badaczami) i odtworzyć proces, który doprowadził do końcowych kategorii.

Jaka jest różnica między kodowaniem ilościowym a jakościowym?

W kodowaniu ilościowym siatka kodów (kategorii) jest zdefiniowana z góry – na przykład z literatury lub z kwestionariusza. Celem jest policzenie, jak często coś się pojawia: ile razy padło określone słowo, jaki procent tekstów zawiera daną kategorię, jak rozkładają się wskaźniki między grupami.

Kodowanie jakościowe (otwarte/osiowe/selektywne) jest znacznie bardziej elastyczne. Kody często powstają indukcyjnie (z danych), mogą być zmieniane i doprecyzowywane w trakcie pracy. Chodzi nie tylko o częstotliwość, ale o zrozumienie struktury znaczeń: jakie motywy współwystępują, jakie są relacje przyczynowe, jak budowana jest narracja lub dyskurs.

Co to jest kod i czym różni się od kategorii w analizie treści?

Kod to krótka etykieta przypisana do konkretnego fragmentu materiału, który uznajesz za istotny wobec pytań badawczych. Dobry kod jest zwięzły, konkretny i jasno sugeruje, co się dzieje w danym fragmencie (np. „obwinianie instytucji”, „obawa przed oceną w social media”).

Kategoria (często: konstrukt analityczny) to zbiór powiązanych kodów, czyli poziom wyżej. Przykład: kategoria „poczucie zagrożenia” może zawierać kody: „strach przed utratą pracy”, „niepewność finansowa”, „obawa przed publiczną krytyką”. To kategorie staną się później głównymi elementami twojego modelu i opisów w raporcie.

Jak wybrać jednostkę analizy przy kodowaniu treści?

Jednostka analizy to „kawałek” materiału, do którego przypisujesz kod: może to być zdanie, akapit, pojedynczy post, komentarz, mem, kadr w wideo czy cała scena. Zbyt mała jednostka (np. pojedyncze słowo) generuje ogromną liczbę drobnych kodów i utrudnia sensowną interpretację; zbyt duża (np. cały artykuł) sprawia, że gubisz szczegółowe wątki.

Uwaga: obok jednostki analizy pracujesz z jednostką kontekstu – szerszym fragmentem, który czytasz/oglądasz, żeby właściwie zinterpretować dane zdanie czy kadr. Możesz kodować jedno zdanie jako „oskarżanie rządu”, ale żeby rozstrzygnąć, czy to ironia, cytat czy realne oskarżenie, potrzebujesz zobaczyć cały akapit albo tekst.

Czym różnią się kody opisowe od interpretacyjnych i kiedy których używać?

Kody opisowe mówią, co dosłownie jest w materiale: „wzmianka o bezpieczeństwie danych”, „wypowiedź eksperta”, „metafora wojny”. Są przydatne, gdy chcesz mieć techniczny log tego, co się pojawia, oraz gdy planujesz późniejsze zliczanie wystąpień.

Kody interpretacyjne dotyczą znaczenia w kontekście badania: „budowanie autorytetu marki”, „eskalowanie poczucia zagrożenia”, „pozycjonowanie klienta jako ofiary”. W kodowaniu otwartym sensowna jest kombinacja obu typów: najpierw łapiesz „gołe” działania (opisowe), a gdy rozumiesz już, co się dzieje, dodajesz kody interpretacyjne. W etapach osiowym i selektywnym zwykle dominują właśnie te drugie, bo to one tworzą finalne modele i narracje.

Najważniejsze punkty

  • Kodowanie jest kluczowym mostem między surowym materiałem (teksty, nagrania, obrazy) a wnioskami badawczymi – tworzy „log” decyzji interpretacyjnych, który można prześledzić i częściowo powtórzyć.
  • Intuicyjne podświetlanie ciekawych fragmentów nie zastępuje systematycznego kodowania: dopiero przypisywanie precyzyjnych etykiet z jasnymi zasadami odróżnia wrażenia badacza od uporządkowanej analizy.
  • Kodowanie (otwarte, osiowe, selektywne) jest uniwersalnym mechanizmem dla analizy treści, dyskursu i narracji – pomaga zapanować nad chaosem danych, wskazać istotne elementy (tematy, strategie, role) i śledzić je w całym zbiorze.
  • Kodowanie jest tylko jednym z etapów szerszego procesu badawczego: łączy pytania badawcze i dobór materiału z późniejszą analizą, interpretacją i raportowaniem, pokazując pełen „łańcuch przetwarzania” danych.
  • Kodowanie ilościowe i jakościowe różnią się celem i logiką: pierwsze zlicza z góry zdefiniowane kategorie, drugie (otwarte/osiowe/selektywne) ma odkrywać struktury znaczeń, relacje i wzorce, często przy elastycznie zmieniającej się siatce kodów.
  • Kod to konkretna, zwięzła etykieta przypisana do znaczącego fragmentu materiału, natomiast kategoria (konstrukt) grupuje powiązane kody na wyższym poziomie ogólności – to one razem budują późniejsze modele, typologie czy teorie.
  • Źródła

  • Basics of Qualitative Research: Techniques and Procedures for Developing Grounded Theory. SAGE Publications (2015) – Klasyczne omówienie kodowania otwartego, osiowego i selektywnego
  • The Coding Manual for Qualitative Researchers. SAGE Publications (2021) – Przewodnik po rodzajach kodów, kategoriach i praktyce kodowania
  • Discourse and Social Change. Polity Press (1992) – Analiza dyskursu, jednostki analizy i relacja języka do władzy
  • Doing Qualitative Research. Guilford Press (2014) – Projektowanie badań jakościowych, rola kodowania w całym procesie

Poprzedni artykułKryteria wiarygodności w analizie jakościowej: jak bronić wyników
Damian Włodarczyk
Etnograf cyfrowy i autor materiałów o obserwacji w środowiskach online. Na AnthroEdu.pl pokazuje, jak badać społeczności internetowe, ścieżki użytkowników i praktyki komunikacyjne bez wyrywania ich z kontekstu. Pracuje metodycznie: prowadzi dzienniki obserwacji, porządkuje dane w repozytoriach i stosuje jasne kryteria kodowania. W tekstach podkreśla znaczenie refleksyjności badacza oraz ochrony prywatności, zwłaszcza przy analizie treści generowanych przez użytkowników. Lubi narzędzia, które ułatwiają raportowanie: mapy wątków, persony oparte na danych i syntetyczne wnioski dla zespołów.