首页 > 建站教程 > Python教程 >
  • Python - 删除停用词

    Python - 删除停用词

    停用词是英语单词,对句子没有多大意义。在不牺牲句子含义的情况下,可以安全地忽略它们。例如,像,他,等等的单词已经在名为语料库的语料库中捕获了这些单词。我们首先将它

    Python - 删除停用词  Pytho  22次
  • Python - 同义词和反义词

    Python - 同义词和反义词

    同义词和反义词作为wordnet的一部分提供,wordnet是英语的词汇数据库。它作为nltkcorpora访问的一部分提供。在wordnet中同义词是表示相同概念并且在许多上下文中可互换的单词,因此它们被

    Python - 同义词和反义词    33次
  • Python - 文本翻译

    Python - 文本翻译

    从一种语言到另一种语言的文本翻译在各种网站中越来越普遍,因为它们迎合了国际受众。帮助我们执行此操作的python包称为translate。可以通过以下方式安装此软件包。它提供主要语言

    Python - 文本翻译  Python文本  9次
  • Python - 单词替换

    Python - 单词替换

    替换完整的字符串或字符串的一部分是文本处理中非常常见的要求。该 **替换()** 方法返回其昔日的出现都换成了新的,可选的替代限制到最大数量的字符串的副本。以下是 **replace(

    Python - 单词替换  Python文本  15次
  • Python - 拼写检查

    Python - 拼写检查

    检查拼写是任何文本处理或分析的基本要求。python包 **pyspellchecker** 为我们提供了这个功能,可以找到可能错误拼写的单词,并建议可能的更正。首先,我们需要在python环境中使用以下命

    Python - 拼写检查  Python文本  17次
  • Python - WordNet界面

    Python - WordNet界面

    WordNet是一个英语词典,类似于传统的词库,NLTK包括英语WordNet。我们可以使用它作为获取单词,用法示例和定义含义的参考。类似单词的集合称为lemmas。WordNet中的单词是有组织的,节点

    Python - WordNet界面  Python文  25次
  • Python - Corpora Access

    Python - Corpora Access

    Corpora是一个展示多个文本文档集合的组。单个集合称为语料库。其中一个着名的语料库是古腾堡语料库,其中包含大约25,000本免费电子书,网址是: http://www.gutenberg.org/ 。在下面的例子

    Python - Corpora Access  Python文  19次
  • Python - 标记单词

    Python - 标记单词

    标记是文本处理的基本特征,我们将单词标记为语法分类。我们借助tokenization和pos_tag函数来为每个单词创建标签。```pyimport nltktext = nltk.word_tokenize(A Python is a serpent which eats eggs from the n

    Python - 标记单词  Python文本  12次
  • Python - Chunks和Chinks

    Python - Chunks和Chinks

    分块是根据单词的性质将相似单词分组在一起的过程。在下面的示例中,我们定义了必须生成块的语法。语法表示在创建块时将遵循的诸如名词和形容词等短语的序列。块的图形输出如

    Python - Chunks和Chinks  Pytho  25次
  • Python - 块分类

    Python - 块分类

    基于分类的分块涉及将文本分类为一组单词而不是单个单词。一个简单的场景是在句子中标记文本。我们将使用语料库来演示分类。我们选择具有来自华尔街日报语料库(WSJ)的数据的

    Python - 块分类  Python文本处  16次
104条 上一页 1 2 3 4 5 6 7 8 9 10 11 下一页