Strona główna Analiza danych jakościowych Kody in vivo: kiedy cytat staje się kategorią analityczną

Zbliżenie kartki z wynikami badań rynku, czerwonym wykresem i ołówkami — Źródło: Pexels | Autor: RDNE Stock project

Analiza danych jakościowych

Kody in vivo: kiedy cytat staje się kategorią analityczną

Q: Jak tworzyć kody in vivo w praktyce krok po kroku?

Najprostsza procedura wygląda tak:nn czytaj transkrypt linijka po linijce lub małymi segmentami;n wyłapuj frazy, które są obrazowe, emocjonalne, często powtarzane lub typowe dla danej grupy;n skopiuj najistotniejszy fragment zdania jako kod, lekko go skracając, ale nie zmieniając sensu, np. z „mam wrażenie, że ciągle biegnę i niczego nie doganiam” robisz „ciągle biegnę i niczego nie doganiam”;n przypisz kod do odpowiadającego mu fragmentu danych.nnUwaga: kody in vivo nie muszą być pełnymi zdaniami. Często lepiej działają krótkie fragmenty, które da się potem łatwo zestawiać w kategorie.

Q: Jakich błędów unikać przy stosowaniu kodów in vivo?

Najczęstsze pułapki to:nn przepisywanie niemal każdej wypowiedzi jako kodu in vivo (efekt: setki rozdrobnionych kodów, które trudno ogarnąć);n traktowanie kodów in vivo jak gotowych kategorii bez przejścia przez etap grupowania i abstrahowania;n zbyt długie etykiety, które są pełnymi zdaniami i później utrudniają analizę i wizualizacje;n ignorowanie istniejącej ramy teoretycznej – kody in vivo mają ją zasilać, a nie zastępować.nnDobry test: jeśli po kilku dniach nadal rozumiesz, co znaczy dany kod in vivo i do jakiego szerszego zjawiska może prowadzić, to najpewniej jest sens go zachować w dalszej analizie.

Przez

Damian Włodarczyk

15/04/2026

Rate this post

Nawigacja po artykule:

Cel czytelnika: po co w ogóle bawić się w kody in vivo

Osoba, która sięga po kody in vivo, zwykle chce dwóch rzeczy naraz: zachować autentyczny język badanych i jednocześnie zbudować logiczną, spójną strukturę analityczną. Chodzi o umiejętność rozpoznawania momentu, kiedy pojedynczy cytat przestaje być tylko ciekawym zdaniem, a zaczyna pełnić funkcję nazwy kategorii opisującej szerszy mechanizm.

Kluczowa jest tu równowaga: z jednej strony wierność wypowiedziom uczestników, z drugiej – metodyczne przejście od surowych cytatów do kategoryzacji i wniosków, które można obronić przed recenzentem, promotorem czy klientem.

Czym są kody in vivo i gdzie mają sens

Definicja robocza i pochodzenie pojęcia

Kody in vivo (często zapisywane też jako kody in-vivo) to etykiety kodowe zbudowane z dosłownych sformułowań uczestników badania. Inaczej mówiąc: zamiast opisywać fragment wywiadu własnymi słowami badacza, bierzesz żywy cytat i używasz go jako nazwy kodu.

Przykład: uczestnik mówi: „Ja mam wrażenie, że ciągle biegnę i nigdy nie doganiam tego, co powinnam”. Kod in vivo może brzmieć: „ciągle biegnę i nie doganiam”. To nie jest jeszcze interpretacja, lecz przechwycenie jego sposobu mówienia.

Źródłowo pojęcie kodów in vivo pojawia się w teorii ugruntowanej (grounded theory). Tam służy do tego, by teoria „wyrastała” z danych, a nie była narzucona z góry. Jednak kodowanie in vivo jest dziś praktykowane także w:

analizie tematycznej,
studiach przypadku,
badaniach UX i badań użytkowników,
ewaluacjach programów społecznych,
badaniach rynku i insightów konsumenckich.

Wszędzie tam, gdzie kluczowy jest język badanych (ich metafory, skróty myślowe, wewnętrzny slang), kody in vivo działają jak „nagranie surowe” przed późniejszym montażem analitycznym.

Kody in vivo a inne typy kodów

Żeby zrozumieć specyfikę kodów in vivo, dobrze je zestawić z innymi typami kodów. Pomaga w tym prosta siatka: od kodów bardzo opisowych po mocno interpretacyjne.

Typ kodu	Źródło nazwy	Poziom abstrakcji	Przykładowy fragment danych	Przykładowy kod
Kod in vivo	Dosłowny cytat uczestnika	Niski (blisko języka uczestnika)	„Czuję się jak chomik w kołowrotku”	„chomik w kołowrotku”
Kod opisowy	Parafraza badacza	Niski/średni	„Czuję się jak chomik w kołowrotku”	poczucie ciągłego kręcenia się w kółko
Kod interpretacyjny	Abstrakcja / teoria	Średni/wysoki	„Czuję się jak chomik w kołowrotku”	doświadczenie wypalenia zawodowego
Kod teoretyczny	Istniejąca teoria / model	Wysoki	Różne wypowiedzi o zmęczeniu, braku sensu	wyniszczenie emocjonalne (komponent wypalenia)

Kod in vivo to więc najbliższy oryginalnemu brzmieniu sposób nazwania fragmentu. Kod opisowy jest już lekką interpretacją (parafrazą), a kod interpretacyjny – krokiem w stronę uogólnienia. W praktyce projektu badawczego używa się zwykle wszystkich tych typów, tylko na różnych etapach.

Kiedy kody in vivo wnoszą realną wartość

Kodowanie in vivo nie ma sensu „dla zasady”. Jego siła ujawnia się w konkretnych sytuacjach, gdy język uczestników niesie dodatkowe znaczenie, którego nie odda sucha parafraza. Szczególnie przydatne są, gdy pojawiają się:

metafory – np. „wszyscy stoimy na ruchomych piaskach”, „praca zdalna to życie w kontenerze”,
potoczne slogany i skróty – np. „jakoś to będzie”, „robimy na partyzanta”,
słowa-klucze grupy (slang, żargon) – np. „dokręcanie śruby”, „wystawianie na front”,
emocjonalnie nasycone frazy – np. „boję się, że się rozsypię”, „jakbym nie istniała”,
refreny powtarzające się w wielu wywiadach – np. „nikt mnie nie słucha”, „ciągle od nowa”.

W takich momentach dosłowny cytat jest nie tylko „ładny”, ale też precyzyjny. Lepiej uchwyca subiektywne doświadczenie niż techniczny opis. Dlatego w dobrze prowadzonym projekcie badawczym kody in vivo traktuje się jako wrażliwe narzędzie do mapowania języka świata badanych, a nie wyłącznie ozdobnik do raportu.

Miejsce kodów in vivo w całym procesie analizy jakościowej

Od danych surowych do kategorii i tematów

Kody in vivo są jednym z elementów większej układanki. Cały proces analizy jakościowej można schematycznie rozpisać jako sekwencję:

Dane surowe – nagrania, transkrypcje, notatki z obserwacji, dokumenty.
Kodowanie – przypisywanie etykiet (kodów) do fragmentów danych.
Kategorie analityczne – grupy pokrewnych kodów dotyczących jednego zjawiska.
Tematy / wątki wyższego rzędu – kilka kategorii połączonych wspólną ideą lub procesem.
Teoria / model / wnioski i rekomendacje – syntetyczny opis mechanizmów, odpowiedzi na pytania badawcze.

Kodowanie in vivo dzieje się głównie w etapie 2, często w jego początkowej fazie (kodowanie otwarte). To wtedy badacz jest najbardziej blisko tekstu i „słucha” języka uczestników, zanim zacznie na serio składać większe struktury.

Na późniejszych etapach te same kody in vivo mogą zostać:

połączone w kategorie wyższego poziomu,
zredukowane (połączenie podobnych kodów),
zachowane jako nazwy kategorii (gdy cytat trafnie oddaje mechanizm),
lub porzucone (gdy okazują się mało ważne dla kluczowych tematów).

Kodowanie in vivo jako część kodowania otwartego

Kodowanie otwarte (open coding) to etap, w którym dane są rozbijane na mniejsze jednostki znaczenia bez z góry ustalonej struktury. Kody in vivo są tu naturalnym narzędziem: umożliwiają maksymalną wrażliwość na to, co i jak mówią uczestnicy, zanim badacz narzuci własne kategorie.

Typowy przebieg:

czytasz transkrypt linijka po linijce,
przy każdej „gęstej” wypowiedzi tworzysz kod – często właśnie in vivo,
nie martwisz się jeszcze o porządek, hierarchię ani nadmiar kodów,
raczej zbierasz „surowy materiał kodowy” do późniejszej porządkującej pracy.

W analizie tematycznej (Braun & Clarke i pokrewne podejścia) kody in vivo są często mieszane z kodami opisowymi. Badacz stosuje cytaty jako kody tam, gdzie język jest nośny, a w innych miejscach tworzy własne, bardziej techniczne etykiety.

Kody in vivo a rama teoretyczna i pytania badawcze

Każde badanie ma jakiś punkt wyjścia: pytania badawcze, hipotezy, ramę teoretyczną. Kody in vivo nie zawieszają tych założeń w próżni, ale zasilają je danymi „z dołu”.

Przykład:

Pytanie badawcze: „Jak pracownicy doświadczają wprowadzania pracy hybrydowej?”.
Rama teoretyczna: teoria kontroli i autonomii w pracy.
Kody in vivo: „jak na smyczy”, „niby wolność, ale na krótkiej lince”, „ciągle muszę się meldować”.

Te cytaty nie tylko ilustrują doświadczenie, ale też sugerują kierunek interpretacji w kategoriach poczucia kontroli, nadzoru, fałszywej autonomii. Kody in vivo zasilają więc późniejsze przejście do kodów interpretacyjnych osadzonych w literaturze.

Współpraca kodów in vivo z codebookiem a priori

W wielu projektach badawczych istnieje już codebook a priori (zestaw kodów zaplanowanych na podstawie literatury, wcześniejszych badań, wymagań klienta). Rodzi się pytanie: jak to pogodzić z otwartym kodowaniem in vivo?

Praktyczny wariant hybrydowy wygląda tak:

utrzymujesz zestaw kodów z góry zdefiniowanych (np. „kontrola”, „autonomia”, „wsparcie przełożonego”),
podczas kodowania możesz przypisać istniejący kod, gdy fragment pasuje do ramy,
równolegle tworzysz kody in vivo tam, gdzie język badanych przynosi coś nowego,
w późniejszej fazie łączysz jedne z drugimi w szersze kategorie.

W efekcie analiza nie jest zamknięta na niespodzianki z danych, ale też nie traci kontaktu z teorią i potrzebami projektowymi. Cytaty jako kody działają tu jak „czujniki” wykrywające to, czego w codebooku jeszcze nie było.

Kody in vivo jako materiał wejściowy, nie produkt końcowy

Istnieje pokusa, by zatrzymać się na etapie kodów in vivo i raportować analizę w postaci „kolekcji citatów”. Dla rzetelnej analizy to za mało. Kody in vivo mają status danych przetworzonych minimalnie, nie gotowych wniosków.

Dopiero gdy kilka kodów in vivo zaczyna tworzyć wspólny wzór (mechanizm, doświadczenie, proces), pojawia się poziom kategorii analitycznych. To ten moment, w którym pojedynczy cytat może „awansować” – o ile rzeczywiście niesie ogólniejszy sens.

Dłoń analizująca wykresy biznesowe na drewnianym biurku — Źródło: Pexels | Autor: Lukas Blazek

Jak wyłapywać potencjalne kody in vivo w transkrypcjach

Jednostka znaczenia i granice cytatu

Podstawowa operacja w kodowaniu to wyznaczanie jednostek znaczenia (ang. meaning units). To fragmenty tekstu, które tworzą spójny sens – mogą mieć formę pojedynczego słowa, frazy, zdania, a czasem krótkiego akapitu.

Dla kodów in vivo najczęściej użyteczne są:

frazy – krótkie, zwarte wyrażenia (np. „ciągły stan gotowości”, „czuję się jak intruz”),
pojedyncze zdania – gdy całe zdanie jest nośne (np. „Praca z domu to jak bycie na wiecznym dyżurze”).

Za długi cytat jako kod traci na użyteczności. Kod powinien być na tyle krótki, by dało się nim operować (porównywać, grupować), ale na tyle wierny, by nie zgubił kluczowego sensu metafory czy emocji.

Jak wyznaczać granice cytatu

Przy podejmowaniu decyzji „ile treści wciągnąć do kodu in vivo” pomocne są pytania kontrolne:

Czy gdy odetnę pierwsze kilka słów, sens się zmieni?
Czy gdy skrócę końcówkę, nadal zostaje to zdanie, które „niesie” sens?
Czy pozostało słowo-klucz lub metafora, dla której tworzę kod?

Przykład:

„Ja mam takie poczucie, że jak wracam do domu po pracy, to wcale nie odpoczywam, tylko dalej jestem w stanie ciągłego czuwania.”

Potencjalny kod in vivo może brzmieć:

„stan ciągłego czuwania” – skrócony, ale zachowujący sedno, albo
„po pracy wcale nie odpoczywam” – jeśli dla analizy kluczowy jest brak regeneracji.

Reszta zdania pozostaje w danych i może być zacytowana w raporcie, ale jako kod operujesz krótszą wersją.

Co czyni cytat „nośnym” jako kod in vivo

Nie każda wypowiedź nadaje się na kod in vivo. Wiele zdań jest informacyjnie poprawnych, ale analitycznie „płaskich”. Nośny cytat ma zwykle jedną lub kilka z poniższych cech:

Gęstość znaczeniowa – w kilku słowach streszcza większe doświadczenie (np. „pracuję na adrenalinie”).

Jak rozpoznawać „gęstość znaczeniową” w praktyce

Przy dłuższych transkrypcjach pojawia się problem selekcji: co jest zwykłym zdaniem, a co potencjalnym „nośnikiem kategorii”? Dobrym filtrem są trzy sygnały:

skróty doświadczenia – jedno wyrażenie kondensuje rozbudowaną historię (np. „żyję od wdrożenia do wdrożenia” zamiast długiego opisu pracy projektowej),
przełącznik perspektywy – moment, w którym badany sam porządkuje doświadczenie („I wtedy zrozumiałam, że tak naprawdę jestem sama z tym wszystkim”),
język, który sam się grupuje – podobne metafory lub obrazy zaczynają się powtarzać w różnych wywiadach.

Uwaga: kody in vivo nie muszą być „ładne literacko”. Czasem najbardziej nośne są potoczne, urwane zdania, o ile dobrze łapią dynamikę procesu, np. „tu się nie pyta, tu się robi”.

Wyłapywanie powtórzeń i „refrenów” w danych

W praktyce badawczej silne kody in vivo bardzo często rodzą się z powtórzeń. Nie chodzi tylko o identyczne słowa, lecz o powracające konstrukcje językowe i obrazy. Przydatne są tu dwa proste nawyki:

oznaczanie refrenów w locie – jeśli podczas kodowania drugi lub trzeci raz widzisz podobne sformułowanie, dodaj do kodu znacznik (np. „[refren]”),
późniejsze filtrowanie – po pierwszym przejściu przez dane przefiltruj listę kodów po tych oznaczonych jako refreny i zobacz, co faktycznie się powtarza.

Przykład z projektu o wypaleniu zawodowym:

„jadę na oparach”,
„lecę już tylko na rezerwie”,
„ciągnę na resztkach sił”.

Technicznie to trzy różne cytaty, ale semantycznie ten sam wzór: funkcjonowanie „na resztkach zasobów”. To dobry kandydat na późniejszą kategorię analityczną, nawet jeśli finalnie zdecydujesz się zachować tylko jedną z tych fraz jako kod in vivo.

Technika kodowania in vivo krok po kroku

Przygotowanie materiału i środowiska pracy

Spójna procedura zmniejsza chaos w późniejszych etapach. Minimalny setup:

oczyszczona transkrypcja – ujednolicone oznaczenia mówców, czytelne wstawki o pauzach, emocjach (np. [śmiech], [cisza]),
ustalone konwencje zapisu kodów – np. kody in vivo w cudzysłowie, kody opisowe bez cudzysłowu; kody w języku danych (PL) vs kody teoretyczne (EN),
narzędzie do kodowania – program CAQDAS (NVivo, MAXQDA, Atlas.ti) albo prosty zestaw: dokument + arkusz kalkulacyjny.

Tip: jeśli pracujesz w zespole, spisz krótką „mini-konwencję” (pół strony A4), kiedy tworzyć kod in vivo, a kiedy opisowy. To oszczędza później dyskusji przy scalaniu codebooka.

Kodowanie linijka po linijce z nastawieniem na język

Kodowanie in vivo jest najbardziej efektywne, gdy tempo czytania jest świadomie spowolnione. Mechanika jest prosta:

Czytasz krótki fragment (1–3 wypowiedzi badanych).
Zadajesz sobie pytanie: „Czy jest tu zdanie/fraza, która mogłaby zostać zapamiętana?”.
Jeśli tak – zaznaczasz tę frazę i tworzysz kod dokładnie w tej formie (ew. z drobnym skróceniem).
Jeśli nie – stosujesz kod opisowy lub przechodzisz dalej.

Przydatna jest mała samokontrola: jeśli po 2–3 stronach transkryptu nie utworzyłeś ani jednego kodu in vivo, możliwe, że zbyt agresywnie narzucasz własne etykiety i tracisz język badanych.

Minimalna edycja cytatu: kiedy wolno ingerować

Kod in vivo nie musi być stuprocentowo dosłownym cytatem w sensie zapisu wszystkich wtrąceń typu „yyy”, „no, jakby”. Zazwyczaj stosuje się zasadę minimalnej edycji:

usuwasz tylko szum (przerywniki, powtórzenia słów bez znaczenia),
nie zmieniasz kolejności słów,
nie poprawiasz gramatyki, jeśli zmieniłoby to ton lub znaczenie.

Przykład:

„No bo ja tak trochę, wie pan, jadę po prostu na oparach cały czas.”

Rozsądny kod in vivo:

„jadę na oparach cały czas” – skrócone, ale wierne, lub
„jadę na oparach” – jeśli „cały czas” powtarza się w innych wypowiedziach jako osobny motyw.

Notatki do kodów in vivo (memos) od razu przy nadawaniu

Kod in vivo jest sam w sobie etykietą, nie interpretacją. Natomiast już w momencie kodowania często pojawia się intuicja: „to brzmi jak coś o kontroli” albo „to chyba idzie w stronę wstydu, nie lęku”. Dobrą praktyką jest doklejanie krótkich memos (komentarzy analitycznych) do kodów:

1–2 zdania: jak rozumiesz ten cytat teraz,
hipoteza: z czym może się łączyć,
ewentualne skojarzenie z teorią lub innymi badaniami.

Te mikro-notatki będą później świetnym paliwem przy przechodzeniu z poziomu cytatu do kategorii.

Kontrola „rozwlekania” listy kodów in vivo

Przy pierwszym projekcie łatwo skończyć z kilkuset unikatowych kodów in vivo, z których połowa pojawiła się raz. Nie jest to błąd, ale zwiększa obciążenie poznawcze w dalszej pracy. Dwa proste mechanizmy kontroli:

limit „nowych” kodów na sesję – np. jeśli masz już 15–20 świeżych kodów z jednej godziny kodowania, w kolejnych fragmentach zastanawiasz się dwukrotnie, zanim dodasz następny,
bieżące sprawdzanie podobieństwa – zanim wprowadzisz kod „ciągnę na resztkach sił”, sprawdzasz, czy nie istnieje już „jadę na oparach”; jeśli tak, przypisujesz istniejący kod.

To nie jest ograniczanie kreatywności, tylko pilnowanie, by lista kodów nie stała się zbiorem synonimów, których nikt później nie połączy.

Kiedy cytat przestaje być tylko kodem, a staje się kategorią

Od pojedynczej etykiety do wzoru w danych

Kod in vivo „awansuje” do kategorii analitycznej, gdy przestaje być tylko pojedynczym, barwnym zdaniem, a zaczyna opisywać powtarzalny mechanizm widoczny w wielu miejscach materiału. Kluczowe pytanie brzmi: czy ta fraza może służyć jako nazwa szerszego zjawiska, nie tylko tego jednego przypadku?

Przykład:

kod in vivo: „ciągle się tłumaczę”,
inny uczestnik: „muszę się wiecznie usprawiedliwiać”,
kolejny: „zawsze muszę się jakoś wytłumaczyć, dlaczego wychodzę wcześniej”.

W pewnym momencie widzisz, że to nie są trzy osobne kody, lecz wspólny wzór: doświadczenie permanentnego usprawiedliwiania się w pracy. Kod „ciągle się tłumaczę” może stać się nazwą kategorii, która obejmie kilka podobnych cytatów.

Kryteria „awansu” kodu in vivo do kategorii

Przy podejmowaniu decyzji, czy cytat może zostać nazwą kategorii, pomocne są cztery kryteria:

Powtarzalność – ten sam lub bardzo podobny sens pojawia się u wielu uczestników lub w różnych kontekstach.
Rozciągalność – fraza daje się zastosować do kilku przypadków bez naciągania (nie jest zbyt „jednostkowa”).
Ostrość znaczeniowa – jasne jest, co znaczy i co odróżnia ją od sąsiednich kategorii.
Teoretyczna „chwytliwość” – da się ją włączyć w szerszą interpretację, model, teorię.

Jeśli cytat spełnia przynajmniej trzy z czterech kryteriów, to dobry kandydat na kategorię nazwaną in vivo.

Przykład transformacji: od kodów in vivo do kategorii

Załóżmy badanie o doświadczeniu oceny rocznej. W kodowaniu otwartym powstały m.in. kody in vivo:

„oni już dawno wszystko postanowili”,
„to teatr jednego aktora”,
„wiadomo, że to tylko formalność”,
„tu nic nie jest do dogadania”.

Na etapie porządkowania widać wspólny mianownik: brak realnego wpływu na proces. Zamiast tworzyć sztuczny, techniczny label typu „percepcja braku partycypacji”, możesz zdecydować, że kategoria będzie się nazywała: „to tylko formalność”. Pod tę kategorię podpinają się wszystkie powyższe cytaty i kolejne, które mają ten sam sens.

Ryzyko „przyklejenia się” do jednego cytatu

Jeżeli pojedyncza fraza jest bardzo mocna literacko, istnieje pokusa, by zrobić z niej kategorię bez sprawdzenia, czy rzeczywiście niesie szerszy wzór. Przykład:

„Czuję się jak mebel, który można przestawić z pokoju do pokoju.”

Brzmi świetnie jako cytat ilustracyjny, ale zanim uczynisz z niego nazwę kategorii („czuję się jak mebel”), sprawdź:

czy inni badani opisują się podobnie (przedmiotowość, bycie „rzeczą” w systemie),
czy ta metafora nie jest zbyt osobista i nie „zgubi” innych wariantów tego doświadczenia.

Czasem lepsza jest kategoria opisowa (np. „bycie traktowanym jak przedmiot”), a cytat zostaje na poziomie kodu i ilustracji w raporcie.

Rola dyskusji zespołowej przy „awansowaniu” cytatów

Jeśli analiza jest zespołowa, moment decydowania, które kody in vivo staną się kategoriami, to dobry punkt na wspólny przegląd. Praktyczny format:

Każdy członek zespołu wybiera po kilka kodów in vivo, które jego zdaniem „ciągną” analizę do przodu.
Na spotkaniu przechodzicie przez te propozycje i zadajecie zawsze te same pytania: co ten cytat opisuje? dla ilu przypadków? z czym go łączymy?
Wspólnie decydujecie, które frazy zostają nazwami kategorii, a które wracają na poziom zwykłych kodów.

Takie mikro-review ogranicza ryzyko, że kategoria analityczna będzie wynikiem gustu jednego badacza, a nie rzeczywistej struktury danych.

Łączenie i porządkowanie kodów in vivo w większe struktury

Grupowanie semantyczne: od synonimów do „rodzin kodów”

Po pierwszym przejściu przez materiał masz zwykle listę kilkudziesięciu lub kilkuset kodów in vivo. Pierwszy krok porządkowania to grupowanie semantyczne – szukanie tego, co znaczy mniej więcej to samo, choć jest zapisane innymi słowami.

Procedura może być prosta i techniczna:

Eksportujesz listę kodów in vivo do tabeli (np. Excel, arkusz w NVivo).
Przeglądasz ją w kolumnie, zaznaczając kody o podobnym sensie (kolorami, tagami).
Tworzysz „rodziny kodów” – tymczasowe zbiory, w których lądują na przykład wszystkie odmiany „jadę na oparach”.

Dopiero na poziomie takich rodzin podejmujesz decyzję, który cytat zostaje reprezentantem (nazwą kategorii lub podkategorii), a które pozostaną jako warianty ilustrujące.

Budowanie osi i wymiarów na bazie kodów in vivo

Kody in vivo świetnie nadają się do konstruowania wymiarów (osi) analitycznych, na których później „rozmieszczasz” przypadki. Przykładowo, w badaniu o pracy zdalnej mogą się pojawić kody:

„jestem cały czas pod telefonem”,
„wreszcie mam święty spokój”,
„ciągle jestem w trybie online”,
„mogę wreszcie się odłączyć”.

Te cytaty sugerują oś: od ciągłej dyspozycyjności do możliwości wyłączania się. Zamiast z góry zakładać wymiar „kontrola–autonomia”, możesz najpierw zobaczyć, jaki język proponują sami badani, a dopiero potem przypisać go do teoretycznej osi.

Mapowanie kodów in vivo na kategorie teoretyczne

Na pewnym etapie i tak trzeba „spotkać się” z teorią lub frameworkiem zamówionym przez klienta. Technicznie wygląda to jak dwustronne mapowanie:

z jednej strony lista kodów in vivo (język badanych),
z drugiej – lista kategorii/koncepcji z literatury (np. autonomia, sprawczość, wyuczona bezradność).

Trzy kierunki mapowania: dopasowanie, napięcie, luka

Przy mapowaniu kody in vivo nie zawsze „wpadają” gładko w gotowe szufladki teoretyczne. Pomaga świadome rozróżnienie trzech sytuacji:

Dopasowanie – cytat dobrze opisuje zjawisko, które już istnieje w teorii, np. „ciągle się tłumaczę” łatwo powiązać z pojęciem accountability (rozliczalności).
Napięcie – kod in vivo częściowo pasuje, ale jednocześnie coś „zgrzyta”. Przykład: fraza „jak nie odpiszę w 5 minut, to już jest dramacik” mieści się w kategorii „mikrozarządzanie”, ale jednocześnie odsłania lęk społeczny i presję grupy.
Luka – powtarzalne kody in vivo nie znajdują oczywistego odpowiednika w istniejących kategoriach. To potencjalne miejsce na nową kategorię teoretyczną lub modyfikację modelu.

Przy dwóch ostatnich warto dopisać osobne memo: co dokładnie nie pasuje i dlaczego. To są często najciekawsze punkty analityczne.

Techniczne ogarnięcie mapowania: prosty workflow

Można to zrobić dość „geekowo”, bez wizualnych fajerwerków, a i tak mieć porządek:

Tworzysz tabelę z kolumnami: kod in vivo, sens/para fraza, kategoria teoretyczna, typ dopasowania (dopasowanie/napięcie/luka), memo.
Dla każdego kodu uzupełniasz krótką parafrazę (2–5 słów „po twojemu”), żeby nie być zakładnikiem samej metafory.
Przypisujesz wstępnie kategorię z teorii lub zostawiasz pustą komórkę, jeśli nic nie pasuje.
Oznaczasz typ dopasowania i dopisujesz jedno zdanie memo, szczególnie przy „napięciu” i „luce”.

Po przejściu kilkudziesięciu kodów widać, które kategorie teoretyczne są „przepełnione”, a gdzie powstają nowe zbiory cytatów wołających o własną nazwę.

Zmiana statusu cytatu przy kontakcie z teorią

Spotkanie kodów in vivo z teorią często zmienia ich status. Trzy typowe scenariusze:

Degradacja – efektowny cytat, który wydawał się kandydatem na kategorię („jestem jak chomik w kołowrotku”), po mapowaniu okazuje się jedną z kilku ilustracji szerszej kategorii „praca w ciągłym biegu”. Cytat zostaje, ale wraca na niższy poziom.
Stabilizacja – fraza dobrze „trzyma” się zarówno danych, jak i teorii. Przykładowo, „to tylko formalność” idealnie opisuje relację do procesu ocen w świetle teorii partycypacji, więc zostaje nazwą kategorii, a jednocześnie łączy się z pojęciem braku wpływu.
Rozszczepienie – pod jednym kodem in vivo znajdują się w istocie dwa różne mechanizmy. Przykład: „jadę na oparach” może dotyczyć przeciążenia zadaniami, ale też braku sensu pracy. Po wejściu teorii motywacji rozdzielasz to na dwie kategorie.

Ta zmiana statusu nie jest porażką kodowania in vivo, tylko naturalnym etapem rafinowania materiału.

Projektowanie ścieżki: od surowego cytatu do modelu

Żeby nie zgubić się w przejściach między poziomami, można zaprojektować prostą, powtarzalną ścieżkę pracy z kodem in vivo. Przykładowy pipeline:

Rejestracja – nadanie kodu in vivo przy fragmencie transkrypcji, z krótkim memo „na gorąco”.
Parafraza – dopisanie neutralnego opisu sensu (bez metafory), najczęściej w osobnej kolumnie lub polu.
Grupowanie – przypisanie kodu do rodziny kodów o podobnym znaczeniu.
Test na kategorię – sprawdzenie kryteriów powtarzalności, rozciągalności itd. dla rodziny kodów.
Mapowanie do teorii – przypisanie (lub nie) do istniejących pojęć, oznaczenie dopasowania/napięcia/luki.
Włączenie do modelu – decyzja, czy dana nazwa in vivo zostaje:
- tytułem kategorii/podkategorii,
- nazwą wymiaru (osi),
- czy tylko cytatem ilustracyjnym w ramach innej kategorii.

Powtarzając ten sam pipeline na kolejnych projektach, można łatwo porównać później, jak różne zespoły pracują z kodami in vivo i gdzie tracą/łapią sens danych.

Kody in vivo a poziomy abstrakcji w raporcie

Język badanych może występować w raporcie na różnych piętrach. Dobrze jest świadomie zadecydować, na którym poziomie który cytat pracuje najefektywniej:

Poziom tytułów kategorii – krótkie, „nośne” frazy, które dobrze skalują się na wiele przypadków („ciągle się tłumaczę”, „to tylko formalność”).
Poziom podrozdziałów/wymiarów – cytaty, które dobrze oddają bieguny osi („jestem cały czas pod telefonem” vs. „mam wreszcie święty spokój”).
Poziom ilustracji – jędrne, indywidualne metafory, które działają mocno obrazowo, ale są zbyt jednostkowe jako nazwy kategorii („czuję się jak mebel”).

To, że kod in vivo stał się kategorią w fazie analizy, nie oznacza, że koniecznie musi być też nagłówkiem w raporcie. Czasem poziom wyżej (bardziej abstrakcyjna nazwa) jest czytelniejszy dla odbiorcy, a in vivo zostaje jako podtytuł lub wyróżnik w tekście.

Balans między językiem badanych a językiem odbiorcy

W projektach na zlecenie pojawia się napięcie: z jednej strony wierność językowi uczestników, z drugiej – oczekiwania decydentów przyzwyczajonych do żargonu biznesowego lub akademickiego. Kilka praktycznych taktyk:

Podwójne nazwy – w raporcie kategoria może mieć formę: „To tylko formalność (percepcja braku wpływu na proces oceny)”. Pierwsza część to in vivo, druga – tłumaczenie „na język klienta”.
Słownik na marginesie – przy pierwszym użyciu nietypowej frazy in vivo dopisujesz w nawiasie krótki opis znaczenia, zwłaszcza gdy metafora jest lokalna („gram w szachy z Excelem” → poczucie ciągłej walki z systemem raportowania).
Szyte na miarę etykiety – gdy klient ma już swój framework (np. kompetencji), możesz użyć go jako „warstwy” nadrzędnej, a in vivo jako subkategorii.

Dzięki temu kody in vivo nie są traktowane jako folklor, tylko jako równoprawny element systemu pojęć.

Kody in vivo w badaniach porównawczych

Przy projektach wielofalowych lub międzygrupowych (np. różne działy, kraje, roczniki) kody in vivo stają się sensownym narzędziem porównania. Kluczowe jest jednak, by nie porównywać „gołych” metafor, tylko ich zoperacjonalizowany sens.

Przykład z praktyki:

zespół sprzedaży: „gonię za targetem”, „żyjemy od targetu do targetu”,
zespół IT: „gasimy pożary”, „ciągle w trybie strażaka”.

To dwie różne metafory, ale parafraza pokazuje wspólny rdzeń: praca w trybie stałej presji i reaktywności. Możesz więc:

na poziomie porównania pracować kategorią „praca w trybie ciągłego napięcia”,
a w opisach grup zachować ich własne in vivo jako lokalne warianty.

Dzięki temu unikasz błędu „oni tak nie mówią, więc to coś innego”, gdy w rzeczywistości rdzeń doświadczenia jest wspólny.

Utrzymywanie wersjonowania kodów i kategorii

Przy pracy z kodami in vivo struktura analityczna zmienia się w czasie. Żeby móc się do tego cofnąć (np. na potrzeby audytu lub publikacji naukowej), dobrze jest wprowadzić prosty system wersjonowania:

oznaczaj datę i zakres zmian w osobnym pliku lub w memos projektu (np. „2026-04-10: połączenie rodziny kodów ‘jadę na oparach’ z ‘ciągnę na resztkach sił’ w kategorię ‘pracuję na granicy wyczerpania’”),
przy większych reorganizacjach (łączenie lub dzielenie kategorii) zapisuj krótkie uzasadnienie: jakie cytaty przesądziły o decyzji.

To szczególnie ważne, gdy nazwa kategorii jest in vivo – z zewnątrz może wyglądać „luźno”, więc ślad analityczny pokazuje, że stoi za nią porządny proces, nie impresja badacza.

Kody in vivo w narzędziach CAQDAS: kilka praktycznych ustawień

Większość programów typu CAQDAS (NVivo, MAXQDA, Atlas.ti) pozwala wyróżniać kody in vivo technicznie. Kilka ustawień, które ułatwiają życie:

Osobna rodzina lub folder – wszystkie kody utworzone in vivo trafiają do jednego klastra, nawet jeśli potem przypisujesz je do innych kategorii. Masz centralny „rejestr języka uczestników”.
Kolorowanie – kody in vivo zaznaczone jednym kolorem na liście lub w tekście. Szybko widzisz, gdzie materiał jest „gęsty” od oryginalnych fraz.
Pola dodatkowe – jeśli narzędzie pozwala, dodaj pole typu „status” (np. roboczy/kandydat na kategorię/kategoria) i „źródło” (np. z jakiego wywiadu). To ułatwia filtrowanie.

Tip: w niektórych programach można wygenerować chmurę słów z samych kodów in vivo. Nie jest to analiza sama w sobie, ale bywa dobrym startem do sesji porządkowania – widać, które metafory dominują w całym zbiorze.

Praca z kodami in vivo w parze badacza i „krytycznego przyjaciela”

Dobrym zabezpieczeniem przed „zakochaniem się” we własnych cytatach jest praca w tandemie: osoba kodująca + tzw. critical friend (krytyczny przyjaciel). Prosty format:

Badacz A przygotowuje shortlistę kodów in vivo, które jego zdaniem zasługują na status kategorii.
Badacz B, niezaangażowany w pierwszą fazę, dostaje tylko:
- cytat (kod in vivo),
- kilka przykładów innych fragmentów przypisanych do tego kodu,
- parafrazę sensu.
Zadanie B: ocenić, czy cytat faktycznie „niesie” wszystkie te przypadki, czy może jest tylko jednym z wariantów.

Ten prosty zabieg często ujawnia kody, które są świetne literacko, ale słabe jako etykiety analityczne – albo odwrotnie: mało efektowne, lecz bardzo stabilne znaczeniowo.

Kiedy odpuścić kody in vivo

Są sytuacje, w których trzymanie się kodowania in vivo bardziej przeszkadza niż pomaga. Kilka sygnałów ostrzegawczych:

badani używają silnie sformalizowanego, „korporacyjnego” języka, który i tak musisz potem rozpakować („optimizujemy procesy pod kątem synergii”); wtedy czyste in vivo niewiele wnosi, ważniejsza jest interpretacja,
masz do czynienia z grupą, która powtarza gotowe slogany (np. kampanie edukacyjne) – kody in vivo mogą wtedy jedynie reprodukować komunikaty, nie doświadczenia,
sztywne trzymanie się dosłownych fraz blokuje uchwycenie wspólnego wzoru, bo każdy mówi „po swojemu”, a ty nie łączysz tego w szerszą kategorię.

W takich przypadkach można ograniczyć użycie kodów in vivo do pojedynczych, naprawdę nośnych fragmentów, a resztę kodować bardziej opisowo, od razu na poziomie sensu.

Świadome przełączanie się między reżimami kodowania

W praktyce analiz jakościowych rzadko ktoś jedzie „czysto” na jednym typie kodowania. Bardziej realistyczny jest tryb hybrydowy: czasem in vivo, czasem opisowe, czasem od razu teoretyczne. Klucz to świadome przełączanie, a nie chaotyczne mieszanie.

Przykładowy pattern pracy z jedną transkrypcją:

Pierwsze przejście – mocne nastawienie na in vivo, łapanie języka badanych i wszystkiego, co cię „zatrzymuje”.
Drugie przejście – dopisywanie kodów opisowych do tych samych fragmentów (czasem równolegle), żeby mieć od razu warstwę parafrazy.
Trzecie przejście (na wybranych fragmentach) – próba wpięcia kodów w pierwsze kategorie analityczne lub osie.

Taki wielowarstwowy zapis (in vivo + opis + później kategoria) powoduje, że możesz wrócić w każdej chwili do poziomu cytatu, nie tracąc przy tym nadrzędnej struktury analitycznej.

Najczęściej zadawane pytania (FAQ)

Co to są kody in vivo w analizie jakościowej?

Kody in vivo to etykiety nadawane fragmentom danych (np. z wywiadów), które są dosłownymi cytatami uczestników. Zamiast opisywać wypowiedź własnymi słowami badacza, przechwytujesz dokładnie to, jak mówi uczestnik, i robisz z tego nazwę kodu, np. „czuję się jak chomik w kołowrotku”.

Taki kod działa jak „zrzut ekranu” z języka badanych: nie jest jeszcze interpretacją ani teorią, tylko wiernym odwzorowaniem sposobu mówienia, metafor i skrótów myślowych. Później te kody mogą stać się bazą do budowania kategorii i tematów wyższego rzędu.

Kiedy stosować kody in vivo, a kiedy lepiej użyć kodów opisowych?

Kody in vivo mają sens wtedy, gdy język uczestnika niesie dodatkowe znaczenie: pojawiają się metafory, mocne emocje, slang („robimy na partyzanta”, „jak na smyczy”), powtarzające się hasła („nikt mnie nie słucha”). W takich momentach dosłowny cytat jest bardziej precyzyjny niż neutralna parafraza.

Jeśli wypowiedź jest prosta, techniczna lub powtarza oczywiste treści, zwykle wystarczy kod opisowy (parafraza badacza), np. „problemy z komunikacją w zespole”. Tip: podczas pierwszego przejścia przez dane ustaw sobie niski próg dla tworzenia kodów in vivo, a przy drugim przejściu usuń te, które nie wnoszą nic ponad zwykłą parafrazę.

Jak tworzyć kody in vivo w praktyce krok po kroku?

Najprostsza procedura wygląda tak:

czytaj transkrypt linijka po linijce lub małymi segmentami;
wyłapuj frazy, które są obrazowe, emocjonalne, często powtarzane lub typowe dla danej grupy;
skopiuj najistotniejszy fragment zdania jako kod, lekko go skracając, ale nie zmieniając sensu, np. z „mam wrażenie, że ciągle biegnę i niczego nie doganiam” robisz „ciągle biegnę i niczego nie doganiam”;
przypisz kod do odpowiadającego mu fragmentu danych.

Uwaga: kody in vivo nie muszą być pełnymi zdaniami. Często lepiej działają krótkie fragmenty, które da się potem łatwo zestawiać w kategorie.

Jak odróżnić kod in vivo od kategorii analitycznej czy tematu?

Kod in vivo to etykieta przypięta do konkretnego fragmentu danych, zwykle jednego cytatu lub jego części. Kategoria analityczna łączy wiele pokrewnych kodów (nie tylko in vivo) opisujących to samo zjawisko, np. „poczucie bycia kontrolowanym”. Temat (wątek wyższego rzędu) obejmuje kilka kategorii związanych wspólną ideą, np. „ambiwalentne doświadczenie pracy hybrydowej”.

Praktyczne kryterium: jeśli etykieta odnosi się do jednego konkretnego sformułowania uczestnika – to kod in vivo. Jeśli zaczyna „przykrywać” kilka różnych cytatów i porządkuje je pod wspólnym mechanizmem – to kategoria lub temat. Czasem dobry kod in vivo awansuje i staje się nazwą kategorii, gdy idealnie trafia w szerszy mechanizm.

Czy można łączyć kody in vivo z codebookiem a priori?

Tak, to wręcz standard w badaniach stosowanych. Możesz mieć z góry przygotowany codebook a priori (np. na bazie literatury: „kontrola”, „autonomia”, „wsparcie przełożonego”) i jednocześnie tworzyć nowe kody in vivo tam, gdzie dane „wychodzą poza” tę ramę.

W praktyce fragment wypowiedzi może mieć dwa typy etykiet naraz: kod teoretyczny z codebooka (np. „poczucie braku autonomii”) oraz kod in vivo (np. „niby wolność, ale na krótkiej lince”). Dopiero na etapie porządkowania kodów decydujesz, które kody in vivo wcielasz do kategorii, a które traktujesz jako ilustracyjne cytaty.

Jak przejść od wielu kodów in vivo do uporządkowanych kategorii?

Po fazie intensywnego kodowania in vivo przychodzi etap „sprzątania”. Najpierw grupujesz podobne kody, szukając wspólnego mianownika. Przykład: „chomik w kołowrotku”, „ciągle biegnę i nie doganiam”, „praca jak taśmociąg” mogą wejść do jednej kategorii typu „poczucie ciągłego biegu bez efektu”.

Następnie redukujesz nadmiar: łączysz synonimiczne kody, usuwasz pojedyncze, marginalne etykiety. Część najlepszych kodów in vivo możesz zachować jako nazwy kategorii (jeśli dobrze chwytają sedno zjawiska), a resztę wykorzystać jako materiał ilustracyjny w opisie wyników.

Jakich błędów unikać przy stosowaniu kodów in vivo?

Najczęstsze pułapki to:

przepisywanie niemal każdej wypowiedzi jako kodu in vivo (efekt: setki rozdrobnionych kodów, które trudno ogarnąć);
traktowanie kodów in vivo jak gotowych kategorii bez przejścia przez etap grupowania i abstrahowania;
zbyt długie etykiety, które są pełnymi zdaniami i później utrudniają analizę i wizualizacje;
ignorowanie istniejącej ramy teoretycznej – kody in vivo mają ją zasilać, a nie zastępować.

Dobry test: jeśli po kilku dniach nadal rozumiesz, co znaczy dany kod in vivo i do jakiego szerszego zjawiska może prowadzić, to najpewniej jest sens go zachować w dalszej analizie.

Cel czytelnika: po co w ogóle bawić się w kody in vivo

Czym są kody in vivo i gdzie mają sens

Definicja robocza i pochodzenie pojęcia

Kody in vivo a inne typy kodów

Kiedy kody in vivo wnoszą realną wartość

Miejsce kodów in vivo w całym procesie analizy jakościowej

Od danych surowych do kategorii i tematów

Kodowanie in vivo jako część kodowania otwartego

Kody in vivo a rama teoretyczna i pytania badawcze

Współpraca kodów in vivo z codebookiem a priori

Kody in vivo jako materiał wejściowy, nie produkt końcowy

Jak wyłapywać potencjalne kody in vivo w transkrypcjach

Jednostka znaczenia i granice cytatu

Jak wyznaczać granice cytatu

Co czyni cytat „nośnym” jako kod in vivo

Jak rozpoznawać „gęstość znaczeniową” w praktyce

Wyłapywanie powtórzeń i „refrenów” w danych

Technika kodowania in vivo krok po kroku

Przygotowanie materiału i środowiska pracy

Kodowanie linijka po linijce z nastawieniem na język

Minimalna edycja cytatu: kiedy wolno ingerować

Notatki do kodów in vivo (memos) od razu przy nadawaniu

Kontrola „rozwlekania” listy kodów in vivo

Kiedy cytat przestaje być tylko kodem, a staje się kategorią

Od pojedynczej etykiety do wzoru w danych

Kryteria „awansu” kodu in vivo do kategorii

Przykład transformacji: od kodów in vivo do kategorii

Ryzyko „przyklejenia się” do jednego cytatu

Rola dyskusji zespołowej przy „awansowaniu” cytatów

Łączenie i porządkowanie kodów in vivo w większe struktury

Grupowanie semantyczne: od synonimów do „rodzin kodów”

Budowanie osi i wymiarów na bazie kodów in vivo

Mapowanie kodów in vivo na kategorie teoretyczne

Trzy kierunki mapowania: dopasowanie, napięcie, luka

Techniczne ogarnięcie mapowania: prosty workflow

Zmiana statusu cytatu przy kontakcie z teorią

Projektowanie ścieżki: od surowego cytatu do modelu

Kody in vivo a poziomy abstrakcji w raporcie

Balans między językiem badanych a językiem odbiorcy

Kody in vivo w badaniach porównawczych

Utrzymywanie wersjonowania kodów i kategorii

Kody in vivo w narzędziach CAQDAS: kilka praktycznych ustawień

Praca z kodami in vivo w parze badacza i „krytycznego przyjaciela”

Kiedy odpuścić kody in vivo

Świadome przełączanie się między reżimami kodowania

Najczęściej zadawane pytania (FAQ)

Co to są kody in vivo w analizie jakościowej?

Kiedy stosować kody in vivo, a kiedy lepiej użyć kodów opisowych?

Jak tworzyć kody in vivo w praktyce krok po kroku?

Jak odróżnić kod in vivo od kategorii analitycznej czy tematu?

Czy można łączyć kody in vivo z codebookiem a priori?

Jak przejść od wielu kodów in vivo do uporządkowanych kategorii?

Jakich błędów unikać przy stosowaniu kodów in vivo?

Inne wpisy, które mogą Ci się spodobać: