You've already forked ui-cheats
lekcia 9
This commit is contained in:
15
README.md
15
README.md
@@ -386,16 +386,19 @@
|
||||
# Lekcia 9: Spracovanie prirodzeného jazyka (NLP)
|
||||
|
||||
- Predspracovanie textu
|
||||
- Aaa
|
||||
- N/A
|
||||
|
||||
- Tokenizázia
|
||||
- Aaa
|
||||
- Rozdelenie textu na menšie časti (_tokeny_).
|
||||
- Token je časť celku a môžme mu rozumieť ako slovo alebo veta.
|
||||
|
||||
- Lematizácia
|
||||
- Aaa
|
||||
- Je proces, pri ktorom sa slová zmenia na svoj základný tvar (_lemma_).
|
||||
- Príklad: "bežím", "bežal", "bežať" => "_bežať_".
|
||||
|
||||
- Stop slová
|
||||
- Aaa
|
||||
- Bežné a často používané slová, ktoré zvyčajne nenesú dôležitý význam pre spracovanie textu.
|
||||
- Príklad: "Pes je na lúke a šteká." => "Pes lúke šteká."
|
||||
|
||||
- POS tagging
|
||||
- Aaa
|
||||
- Part-of-Speech (_POS_) tagging
|
||||
- Proces, pri ktorom sa každému slovu v texte priradí slovný druh (podstatné meno, sloveso, prídavné meno, predložka, atď).
|
||||
Reference in New Issue
Block a user