1
0
This commit is contained in:
2025-04-22 22:41:32 +02:00
parent 866ceb1cc7
commit 6bd7442ce0

View File

@@ -386,16 +386,19 @@
# Lekcia 9: Spracovanie prirodzeného jazyka (NLP) # Lekcia 9: Spracovanie prirodzeného jazyka (NLP)
- Predspracovanie textu - Predspracovanie textu
- Aaa - N/A
- Tokenizázia - Tokenizázia
- Aaa - Rozdelenie textu na menšie časti (_tokeny_).
- Token je časť celku a môžme mu rozumieť ako slovo alebo veta.
- Lematizácia - Lematizácia
- Aaa - Je proces, pri ktorom sa slová zmenia na svoj základný tvar (_lemma_).
- Príklad: "bežím", "bežal", "bežať" => "_bežať_".
- Stop slová - Stop slová
- Aaa - Bežné a často používané slová, ktoré zvyčajne nenesú dôležitý význam pre spracovanie textu.
- Príklad: "Pes je na lúke a šteká." => "Pes lúke šteká."
- POS tagging - Part-of-Speech (_POS_) tagging
- Aaa - Proces, pri ktorom sa každému slovu v texte priradí slovný druh (podstatné meno, sloveso, prídavné meno, predložka, atď).