type
status
date
slug
summary
tags
category
icon
password
Property
Jun 28, 2024 03:13 PM
文章来源
这本书的质量很高,贴一个其他人的读书评价。
在工程领域有时候靠瞎凑也能够得到一个凑合可用的结果,但长期来看维护这些瞎凑搭起来的东西代价非常巨大,不仅结构混乱丑陋,而且由于说不清瞎凑背后的道理,在以后的修改维护时也根本无从下手;反之,如果从更高的数学模型层面去抽象问题,去寻找一个正确的模型框架,就可以有条理地慢慢去填充细节,逐渐达到完善。这样的解决方案不仅能达到需求,而且结构清晰道理明了,便于日后的维护和修正(这大概也是数学之美的另一种表现吧)。
整个自然语言处理,还是要放在信息论的框架之下
1、很多思想是可以借用的
2、很多公式也是可以直接套用的
3、信息论的经典模型,就是编码、传输、解码,自然语言处理天生就符合这个模型。
自然语言处理的突破
1、语法分析,使用规则识别,会无限增加,并且很多会自相矛盾
2、从统计学角度看,解决绝大部分的问题
学习的基础
1、自然语言处理的基础是统计学、线代。
关于工具的ak47原则
任何一个好的工具都应该具备以下特点:
1、简单,工具本身足够简单
2、有效,能够解决用户80%以上的问题
3、可靠,耐操,不会经常性的出问题
4、可解释性强,方便问题能够清晰的定位,有助于工具的逐步改进
关于这个点,有些个人感悟需要说明,做设计的时候,不要过度设计。尽量的去控制投入的时间和成本,在尽量短的时间内解决问题。这个其实我个人的习惯特别不好,总是想出一个比较好的结果,拖拖拉拉。到了交付的时间又胡搞。
解决问题一定要建模或者抽象化
1、从个案中考虑解决问题的要素,区分要素是变化的还是固定的。
2、考虑各个要素的关系,函数分层。
3、尝试对每层函数求解
4、观察函数的普适性,再对函数进行微调。
自然语言处理的过程就是在不断的消除信息的不确定性
- 作者:令狐afmaof
- 链接:https://tangly1024.com/article/49180552-31c9-4ce2-9b62-ae21cb3af47d
- 声明:本文采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。