您好,欢迎光临上海图书公司! 登录
情感分析(人工智能如何洞察心理)/人工智能超入门丛书
ISBN:9787122423092
作者:作者:龚超//张鹏宇//喻涛|责编:雷桐辉//周红//曾越
定价:¥69.8
出版社:化学工业
版次:第1版
印次:第1次印刷
开本:2 平装
页数:189页
商品详情
目录

第1章  语挚情长路漫漫
  1.1  文中自有真情在
    1.1.1  问世间情为何物
    1.1.2  触景文下留真情
  1.2  NLP来相助
    1.2.1  什么是NLP
    1.2.2  NLP主要应用领域
  1.3  情感即分类
    1.3.1  情感分析的对象与方法
    1.3.2  情感分析的主要应用
第2章  情感词典查情断意
  2.1  分词与词典
    2.1.1  分词,情感分析第一步
    2.1.2  词典,让AI长知识
  2.2  只有“情感”行不行
    2.2.1  情感词典的建立
    2.2.2  词典的扩充
  2.3  基于情感词典的案例
第3章  玩转文本大数据
  3.1  数据的获取
    3.1.1  网络爬虫
    3.1.2  简单爬虫案例
  3.2  数据的清洗与整理
    3.2.1  去除停用词
    3.2.2  词性标注
  3.3  词频与词云
    3.3.1  词频统计
    3.3.2  关键词统计
    3.3.3  词云
  3.4  词袋模型
    3.4.1  词袋模型概念
    3.4.2  简单词袋模型案例
    3.4.3  改进词汇表
    3.4.4  词袋模型显示频率
    3.4.5  词袋模型的局限性
第4章  机器学习洞察句情
  4.1  机器学习概述
    4.1.1  什么是机器学习
    4.1.2  机器学习与情感分析
    4.1.3  词袋模型数据生成
  4.2  朴素贝叶斯与情感分析
    4.2.1  贝叶斯vs频率
    4.2.2  朴素贝叶斯原理实践
  4.3  二项逻辑回归与情感分析
    4.3.1  逻辑回归原理
    4.3.2  逻辑回归算法
第5章  神经网络触景悉情
  5.1  神经网络工作原理
    5.1.1  神经网络概述
    5.1.2  前向与反向传播
    5.1.3  其他参数
  5.2  激活函数与损失函数
    5.2.1  非线性的激活函数
    5.2.2  衡量优劣的损失函数
  5.3  神经网络的分类与情感分析
第6章  向量构筑语义空间
  6.1  另辟蹊径分布表示
    6.1.1  语料库
    6.1.2  分布式假说
  6.2  从NPLM到Word2Vec
    6.2.1  NPLM模型
    6.2.2  Word2Vec
  6.3  Word2Vec实践
    6.3.1  “女人-男人=王后-国王”的三国解读
    6.3.2  词汇的星空
第7章  深情厚意咬文嚼字
  7.1  循环神经网络
    7.1.1  循环神经网络原理
    7.1.2  循环神经网络实践
  7.2  LSTM
    7.2.1  LSTM基本原理
    7.2.2  非礼勿记、非礼勿听、非礼勿言
  7.3  循环神经网络与情感分析
附录
  附录一  PyTorch入门
  附录二  概率基础
  附录三  腾讯扣叮Python实验室:Jupyter Lab使用说明

精彩页/试读片段

    1.1  文中自有真情在
    1.1.1  问世间情为何物
    “情感”(emotion)一词的历史可以追溯到1579年,来源于法语单词émouvoir,意思是“煽动”。情感(emotion)一词被引入学术讨论中作为各种情感的总称(如passion, sentiment, affection),它由托马斯·布朗(Thomas Brown)在1800年代初创造。大约在1830年代,现代情感概念首次出现在英语中,由于很多英语单词都能表示情感,为了辨析它们,有学者甚至对它们之间的细微之别进行了研究。
    情感是与神经系统相关的生物学状态,神经生理变化是由与思想、感觉、行为反应以及某种程度的愉悦或不高兴相关的神经生理变化引起的。人们的情感也容易受到很多事物的影响,比如其他人的观点会影响到一个人的情感,如羊群效应等;还有如当一个人拥有某项事物后情感也会发生改变,如禀赋效应等。这些效应与人们的心理息息相关。
    关于情感的定义,目前学界还未达成一个共识。通常认为,情感往往与心情(moods)、性情(temperament)、个性(personality)、性格(disposition)、创造力(creativity)和动机(motivation)交织在一起。
    人工智能如何对情感进行辨识,首要的任务就是需要对其进行分类,每一类均被假设具有一些可以量化的特征,因此,这就涉及情感分类(emotion classification)问题。遗憾的是,情感分类和情感一样,也是在学界备受争议的问题,涉及人们如何区分和对比一种情感和另一种情感。目前通常从离散情感和维度情感上对情感进行描述。
    之所以被称为情感,是因为假设情绪可以通过人的面部表情和生物过程来区分。保罗·埃克曼(Paul Ekman)等学者提出了六种基本情绪:生气、厌恶、恐惧、高兴、悲伤和惊讶,这六种基本情绪在情感研究领域使用较为广泛。
    1980年,罗伯特·普拉奇克(Robert Plutchik)创建了著名的普拉奇克情感之轮(Plutchik's wheel),为理解情绪和其背后的目的提供了一个框架。普拉奇克的情感之轮是一个由八种情绪,即喜悦、信任、恐惧、惊讶、悲伤、厌恶、愤怒和期待构成并可延展至几十种情绪解释的模型,如图1-1所示。
    1.1.2  触景文下留真情
    本书中所涉及的情感分析(sentiment analysis),又称观点挖掘,是指利用自然语言处理、文本分析、计算语言学和生物计量学系统地识别、提取、量化和研究情感状态和主观信息。因此,本书中所提及的文本情感分析无法做到“察言观情”,无法理解声情并茂,只能通过人们的“文下留情”进行分析。
    笔者在这里做一个事先声明,以下“情感分析”如果没有特别提及,均指利用文本进行情感分析,这是因为在人工智能其他领域,如利用视觉、语音等,也可进行情感分析。
    与客观描述类的信息不同,情感是一个人主观的表达,比如情感分析中,如果没有主观的观点,仅仅只是一个客观的描述,很难利用这样的信息去进行分析。之所以能够进行情感分析,是因为文本中体现了人之常“情”。
    自从2000年以来,情感分析已经成为自然语言处理领域中一个十分重要的研究方向。尽管之前也有一些学者进行了大量的观点挖掘、情感词抽取、倾向分析以及主观性分析等工作,然而“情感分析”一词最早由Nasukawa和Yi在2003年提出?。之所以在公元2000年前很难发展,部分原因是分析数据难以获取。
    机构过去往往需要通过大量的调查问卷、访谈等方式进行调研。之后,随着互联网及社交媒体的快速发展,如论坛、博客、微博等网络社会媒体兴起后产生的大数据推动了情感分析的研究,情感分析也成为分析这些文本大数据必不可少的技术手段。
    在这些大数据中,包含着人们褒贬不一、乐观悲情、支持反对、赞赏批评的意见和观点,而且由于意见和观点具有一定的“隐蔽性”,即人们没有必要在评论上遮遮掩掩,所以发表观点相对而言,更能代表人们真实的情感。现在,情感分析在很多学科的研究及各领域中均得到了广泛的应用,比如经济学、管理学、社会学等,再比如像快消行业、零售行业、金融业、房地产、旅游、工业等。
    图1-2是谷歌趋势(Google Trends)给出的“情感分析”的日数据,可以看到从2004年2月开始,到2021年5月,情感分析的热度一直处于上升的态势。
    P2-5

最近浏览过的书籍