1
0
This commit is contained in:
2025-04-22 22:41:32 +02:00
parent 866ceb1cc7
commit 6bd7442ce0

View File

@@ -386,16 +386,19 @@
# Lekcia 9: Spracovanie prirodzeného jazyka (NLP)
- Predspracovanie textu
- Aaa
- N/A
- Tokenizázia
- Aaa
- Rozdelenie textu na menšie časti (_tokeny_).
- Token je časť celku a môžme mu rozumieť ako slovo alebo veta.
- Lematizácia
- Aaa
- Je proces, pri ktorom sa slová zmenia na svoj základný tvar (_lemma_).
- Príklad: "bežím", "bežal", "bežať" => "_bežať_".
- Stop slová
- Aaa
- Bežné a často používané slová, ktoré zvyčajne nenesú dôležitý význam pre spracovanie textu.
- Príklad: "Pes je na lúke a šteká." => "Pes lúke šteká."
- POS tagging
- Aaa
- Part-of-Speech (_POS_) tagging
- Proces, pri ktorom sa každému slovu v texte priradí slovný druh (podstatné meno, sloveso, prídavné meno, predložka, atď).