O czym rapują polscy raperzy na przestrzeni ostatnich 20 lat? – Analiza

Zainspirowany przez sawka.pro/ranking postanowiłem pójść krok dalej i dowiedzieć się jak zmieniła się tematyka tekstów polskich raperów na przestrzeni ostatnich 20 lat.

Na pierwszy rzut oka (albo i ucha), słuchając np. Molesty z 1998 i dajmy na to Taco Hemingway’a z 2017, różnica jest wyraźna. Ale gdyby przeprocesować te dane i ująć to całościowo, płyta po płycie, tekst po tekście – czy i jaka różnica jest widoczna?

Przybliżę Wam najpierw metodykę tej analizy.

  1. źródłem tekstów jest portal genius.com, a że jest tam przede wszystkim UGC – pierwszym założeniem jest zaufanie do poprawności tekstów.
  2. w analizie uwzględnione są lata 1998 – 2017.
  3. pobrane teksty podzieliłem na pojedyncze słowa, pomijając jednoliterowe „a”, „i”, „z”, itp.
  4. czasowniki zostały skonwertowane do bezokoliczników a rzeczowniki do mianowników liczby pojedynczej za pomocą polimorfologik 2.1.
  5. policzyłem % wystąpień słów (w stosunku do wszystkich) w każdym z lat (używając daty premiery albumu – pobranej również z genius.com)

Żeby nie być gołosłownym – trochę statystyk dotyczących analizy.

  • 20 lat
  • 286 artystów
  • 941 albumów
  • 9,957 utworów
  • 3,348,728 słów

Analiza zaczyna się od Kalibra 44 – „W 63 Minuty Dookoła Świata” (wyd. 2 marzec 1998) i Molesty – „Skandal” (wyd. 23 marzec 1998), a kończy na tekstach z nie wydanych jeszcze (na dzień dzisiejszy 2017-11-20) albumów Palucha – „Złota Owca” i Siwersa – „Huśtawki”. Pełna lista artystów, albumów i utworów tutaj.

Ilość artystów, albumów objętych analizą & średnia ilość utworów/album.


Jako ciekawostka - % udział części mowy w analizowanych tekstach.


No to do rzeczy! Zobaczcie 20 najczęściej występujących czasowników/rzeczowników w tekstach na przestrzeni ostatnich 20 lat (częściej występujące od góry).


Na pierwszy rzut oka nie wygląda na to żeby z czasem zaszły jakieś istotne zmiany – kilka słów wyżej w rankingu, kilka niżej, ale generalnie zestaw podobny… Zobaczmy zatem top 20 czasowników i rzeczowników w osobnych listach.




I co? Coś wiemy ale niestety niewiele więcej. Wnioski mogą się zatem pojawić jeśli pod uwagę weźmiemy częstość występowania słów i jej zmianę w czasie.

Gwoli wyjaśnienia poniższych statystyk – częstość to liczba wystąpień danego słowa w średnim tekście w danym roku. Średni tekst w analizowanej próbce ma 336 słów – jeśli słowo występuje z częstością = 2 znaczy to że pojawia się średnio 2 razy w każdym kawałku w danym roku, a 0.1 – raz na dziesięć utworów.

Na początek wizualizacja top 10 rzeczowników wraz z częstością ich występowania w tekstach.



Poniżej top 10 czasowników.


Jeszcze ciekawiej się robi gdy zestawimy ze sobą konkretne słowa ze sobą np. serce vs. rozum albo miłość vs nienawiść. Na początek ciekawostka czyli „ziomek” i jego pochodne (ziom, ziomal, ziomuś i swojski ziomeczek).


Teraz trochę bardziej egzystencjalnie czyli być + wierzyć vs mieć + chcieć.


Zainteresowanie policją (słowa policja i policyjny).


Uczuciowo (miłość + kocham vs nienawiść + nienawidzę).


Preferencje alkoholowe.


Czy raperzy patrzą w przyszłość?


Czym się kierują w życiu?




A tutaj ciekawostka nr 2 – częstość występowania wulgaryzmów (chuj, chujowo, chujowy, cipa, cipka, jebać, jebnąć, kurwa, kutas, najebać, napierdalać, pierdolić, pizda, skurwiel, skurwysyn, wkurwiać, wkurwić, wpierdalać, wpierdolić, wyjebać, wypierdalać, zajebać, zapierdalać)


Wnioski niech każdy wyciągnie sam. Dajcie znać jakie są Wasze przemyślenia, zapraszam do dyskusji i komentarzy.

PS. Mam nadzieję, że w drugiej części uda się znaleźć kilka nowych, ciekawych zestawień słów i mocniej zagłębić w tematykę tekstów analizując tzw. 2-gramy.

Do zobaczenia!

Kuba

Nowa odsłona<< >>Którzy raperzy kupują lajki?

Leave a Reply

Your email address will not be published.