You've already forked ui-cheats
lekcia 9
This commit is contained in:
15
README.md
15
README.md
@@ -386,16 +386,19 @@
|
|||||||
# Lekcia 9: Spracovanie prirodzeného jazyka (NLP)
|
# Lekcia 9: Spracovanie prirodzeného jazyka (NLP)
|
||||||
|
|
||||||
- Predspracovanie textu
|
- Predspracovanie textu
|
||||||
- Aaa
|
- N/A
|
||||||
|
|
||||||
- Tokenizázia
|
- Tokenizázia
|
||||||
- Aaa
|
- Rozdelenie textu na menšie časti (_tokeny_).
|
||||||
|
- Token je časť celku a môžme mu rozumieť ako slovo alebo veta.
|
||||||
|
|
||||||
- Lematizácia
|
- Lematizácia
|
||||||
- Aaa
|
- Je proces, pri ktorom sa slová zmenia na svoj základný tvar (_lemma_).
|
||||||
|
- Príklad: "bežím", "bežal", "bežať" => "_bežať_".
|
||||||
|
|
||||||
- Stop slová
|
- Stop slová
|
||||||
- Aaa
|
- Bežné a často používané slová, ktoré zvyčajne nenesú dôležitý význam pre spracovanie textu.
|
||||||
|
- Príklad: "Pes je na lúke a šteká." => "Pes lúke šteká."
|
||||||
|
|
||||||
- POS tagging
|
- Part-of-Speech (_POS_) tagging
|
||||||
- Aaa
|
- Proces, pri ktorom sa každému slovu v texte priradí slovný druh (podstatné meno, sloveso, prídavné meno, predložka, atď).
|
||||||
Reference in New Issue
Block a user