提高抽象思维能力
从高中数学、物理上是很明显能体现出来自己的抽象思维挺差劲。上初中的时候,我觉得这些科目简直都是小儿科,但在高中我傻眼了,数学和物理都跟不上。特别是物理,涉及到电磁力相关的我完全想象不来,高考物理简直就是我的噩梦。数学虽然可以通过努力让成绩显得不是那么差,但是到底学了个啥,只有自己清楚。大学的微积分更有些听天书的感觉了,虽然最后的考试能过关,但离理解还差的太远了。
在学了这个专栏之后,我知道具体的原因在哪里了,就是自己的抽象能力太差了。这如同原始人刚有数字的概念,能理解 1,2,3。但是 0 是什么,太难了。因为微积分已经从静态转向了动态,如果没有更加抽象的思维,是很难理解微积分的。
对于算法,我很头疼,好多次拿起书,或者看视频都觉得离掌握太远了。学习数学是要弥补这方面的缺陷,为了能更好把自己的专业知识理解的更加透切。工作了这么多年,我已经可以在大脑中模拟代码的运行,精通命令行的使用精髓,文件系统中的在大脑中井井有条。但是算法以及数据结构的离到这种地步差的还是太远,我需要有更高的抽象思维能力来提升自己的能力。
专栏笔记
数学作为一切科学的基础,它化繁为简,直击本质的思考方式,让很多人受益。
数学是一种抽象的知识体系,而我们人要靠经验感知才能认识世界,这中间需要一个桥梁。
一个学好数学最重要的办法是,不断训练自己的思维方式。
训练快速反应最好的办法就是多听多看。但是训练 Deep Thinker,就需要练习一环扣一环解套的本事了。
数学的各个分支,无论难易,从体系到研究方法,再到应用方法是共通的。
毕达哥拉斯是将数学从经验上升到系统性学科的第一人。他确立了数学的起点,也就是必须遵循严格的逻辑证明才能得到结论的研究方法。
毕达哥拉斯真正的错误在于,他不懂得要维系这个体系,需要定义“无理数”这样的概念。无理数造成的数学危机解决之后,数学反而发展了,并没有像毕达哥拉斯想的那样崩溃。
毕达哥拉斯另一个了不起的成就,就是算出了黄金分割的比例。从黄金分割出发,毕达哥拉斯发现了数学和美学的关系,并且开始用数学指导音乐。
从特例到引理再到定理、推论、最后到应用的全过程。
数学通识教育,一个重要目的就是让大家习惯于使用这样的抽象工具。
向量和线性代数,就是把数学从单纯的数值,变成了有方向的数值。这两大知识点,最能代表代数模块的内涵,可以帮助大家提升认知。
对于微积分,它和初等数学的工具不同点在于:人们开始把数学从关注静态的关系,变成了对动态规律,特别是瞬间规律的把握上。
纵观数学发展的历程,以及我们应该具有的数学思维历程,我们可以看到这样的趋势,从个案到整体规律,从个别定理到完整的知识体系,从具体到抽象,从完全的确定性,到把握不确定性。
一个命题在没有证明之前,只能算是猜想,比如著名的哥德巴赫猜想。
度量出来的几何和真正的数学还有很大的差距。
在数学上,观察的经验可以给我们启发,但是它不能成为我们得到数学结论的依据,数学上的结论只能从定义和公理出发,使用逻辑严格证明得到,不能通过经验总结出来。
数学的结论只能从逻辑出发,通过归纳或者演绎得出来。它必须完全正确,没有例外,因为但凡有一个例外(也称为反例),就要被完全否定掉。
数学世界和测量世界第二个区别就是,数学理论必须要证明,保证没有例外。
因为数学上的每一个定理都是一块基石,后人需要在此基础上往前走,试图建立一块新的基石,然后数学的大厦就一点点建成了。在这个过程中不能有丝毫的缺陷,一旦有,整个数学大厦就轰然倒塌了。
数学上的每一个定理,必须也只能通过逻辑推演来证明,用多少实例来验证都没有用。
有了一个个的定理,数学就得以建立起来,而且这个建立在逻辑推理基础上的大厦很坚固。
毕达哥拉斯有一很怪的想法,他坚信世界的本源是数字,而数字必须是完美的。整数很完美,而且分数的分子分母也都是整数,不会是零碎的,因此很完美,整数和分数所构成的有理数让毕达哥拉斯一直坚信自己的想法。
无理数的危机也带来了数学思想一次大的飞跃,它告诉人们,人类在对数学的认识还具有局限性,需要有新的思想和理论来解释,认识本身不能有禁区,那些事先为科学设定的条条框框,最终都不得不被抛弃掉。
人类在科技历史上,很多重大的发明恰恰来自上述的矛盾。
这些矛盾有时看似造成了数学危机,但是,人们化解了危机之后,就拓展了认知,建立想了新的理论。
在自然科学上,很大重大的发现,最初都不是直接和间接观测到的,而是根据数学推导出来 ,比如说黑洞、引力波但是如此。
世界上有很多我们不能停靠直觉和生活经验理解的事物,但是我们可以从数学出发,经过一步步推导得到正确的结论,我们甚至不需要亲力亲为地做一遍就知道我们的结论一定是正确的。
康德说:“世界上只有两样东西是值得我们深深景仰的,一个是我们头上的灿烂星空,另一个是我们内心的崇高道德法则。”
数学思维高深精妙,但是万法归一,最重要的那个原则就是,从逻辑出发想问题,这样就可以发现很多日常中被忽略的问题,从而找出真正答案。
贝尔他们的逻辑其实很简单,就是我们常常说的“复利”增长从数学上讲是无法长期为继的。
做投资的人都清楚,在一开始投资基数较小的时候,能够维持指数增长,一旦基数变大,就做不到了,还不切实际地想维持,就是拆东墙补西墙的庞氏骗局了。
更糟糕的是,给购房者提供次级贷款的银行,后面的保险公司以及很多购买了 CDS 的投资银行也完蛋了,整个金融体制就跨了。
数学思维是什么?它不是是指算小账算得清楚,而是说善于基于数学知识,使用逻辑发现问题,或者预见到不得不做的事情。
常常说“算笔账”这三个字,其背后其实就是说基于一些事实,用数学这个工具来考量,发现问题。
中国即不可能拥有全世界所有的财富,还让世界其它地区买得起中国的商品,这也违背了矛盾律。
$a^3$+$b^3$ = $c^3$,这个问题困扰了人类几千年,后来有一个叫费马的数学爱好者提出一个假说,说除了平方的情况,其他更高次方的议程都找不到整数解,它被称为费马大定理(或者费马最后定理)。
费马大定理的证明过程导致了很多数学研究成果的出现,特别是对于椭圆方程的研究。今天区块链技术用到的椭圆加密方法,就是以它为基础的。
数学是世界上最严密的知识体系,任何的推导不能有丝毫的纰漏。怀尔斯差点因为一个小的疏忽毁掉了整个工作,希望通过这一点,大家对数学的严密性有所体会。
第十问题其实隐含了一个更为深刻的认识论问题,就是对于大部分数学问题,我们能否找到答案?到目前为止,我们所能解决的数学问题其实只是所有数学问题中很小的一部分。
纯数学这个学科除了需要一些运气之外,比拼的是人的智力,智力到哪个程度,成就到就哪个水平,这倒不是宿命论,而是说明人要根据自己的特长选择做事。
很多问题最后证明找不到严格推导出来的解析解,当然这也不妨碍大家大工程上可以使用近似的数值解,解决实际问题。
第十问题是一个硬的边界,不用尝试逾越。但是数学的边界有些时候不是我们解决问题的边界,因为世界上除了数学的方法,还有其他方法。
黄金分割的这个比例是很容易算出来的。根据黄金分割上述的相似性质,我们很容易算出来X/Y的比例是 1.618 左右,更精确地讲,是 $(\sqrt{5} + 1) \div 2$,这是一个无理数,通常用希腊字母Ф来表示。
不仅蜗牛壳如此,龙卷风的性质乃至像银河系这样星系的开关都是如此。这不是巧合,而是因为任何东西从中心出发,同比例放大,必然得到这样的形状。
毕达哥拉斯和他的学派对音乐和美学的影响一直影响到柏拉图和亚里士多德,以及后来诸多文艺复兴的学者。
很多真正高水平的数学家,他们不仅能够研究复杂的理论问题,还能够为复杂的实际问题找到简单的,可重复的解决方法。
在很多的时候决定好坏的因素不止一个,而衡量标准也不止一个,所以很多看起来简单的优化问题,往往在设计时就得非常复杂。
线性规划的本质是将实际应用中那些复杂的非线性求解问题,变成很多个线性方程的问题。
优先法有两个含义,首先它能够找到实际问题的最佳解。其次,它强调寻找最优解的方法本身最简单,或者说最优,具体来说,就是用最少的试验次数来找出最优解在哪里。
华先生用了一个非常生动形象的方法来解释这一特征,他称为折纸法,即把第一个黄金分割点,点在一张纸上,然后把纸从中间对折一下,第二个黄金分割点的位置也显就出来了。
优选法的效率可以从理论上严格证明。比如说做 5 次试验,就可以将范围缩小到原来的 9%,6 次可以将范围缩小到 6% 以下。
华罗庚先生的贡献在于找到一种一线职工都很容易掌握和运用的数学方法来解决实际问题,并且用非常通俗的语言把复杂的方法简单化。
在投资的比例上,我喜欢将 60% ~ 65% 左右的资产放在回报高,风险也相对高点的股市上,这基本上符合黄金分割的比例。在剩余的大约 38% 的资产中,大约 25% 左右放在相对稳妥的债券上,这也大约是 38% 的黄金分割点。最后的百分之十几,则是各种复杂的组合投资。
在很多需要作决定的事情上,我自觉或者不自觉地把作决定的时间放在黄金分割点或者反方向的黄金分割点上。
绝大部分情况下,有准则总比没有好。
通过学习一些数学知识的方法,帮助我形成了系统的做事方法,并且改进了看世界的角度。
斐波那契数列,Rn 这个比值,很快趋近于 1.618 了,这恰好是黄金分割的比例。
Fn | 1 | 1 | 2 | 3 | 5 | 8 | 13 | 21 | 34 | 55 |
Rn | 1 | 2 | 1.5 | 1.66 | 1.6 | 1.625 | 1.615 | 1.619 | 1.618 | 1.618 |
首先,这个数列最终的走向是收敛于黄金分割的比例,但是在一开始的这几个数,并不符合这个规律。这在数学上不是偶然现象,很多时候,仅仅通过少数几个数字得到的所谓的“规律”,其实和采用大量数据后得到的规律完全是两回事。
根据生物遗骸体内碳 -14 的比例,结合碳 -14 衰变的速度(也称为半衰期),就能算出古代生物距今的时间。
数列,其实讲的就是一个趋势。很多时间,我们不仅关心当前这个数有多大,或者我们有多少钱,多少资源,还关心明天它能变得多大,变得多快,这就为数列的意义。
很多人误以为只要从无限多的人身上挣钱,就能挣很多钱,这其实不了解级数这个概念而产生的误解。
任何一个产品,要想成为爆款,都需要提高转发率 p 这个比例,也就大家使用后满意,然后愿意主动宣传的比例。
能够让链式反应维持的最小铀块体积被称为临界体积,它其实就是保证 r > 1 的体积。原子弹的临界体积是多少起初大家并不清楚,而这又显然无法通过试验测量出来,因为搞不好就会产生核爆炸。
借钱不要去所谓的 P2P 一类机构,永远记住“卖的人比买的人精”,不要试图贪便宜。
加息意识着同样面值的债券实际价值的贬值,降息意味着同样面值债券的升值。
未来在中国,随着金融市场的完善,债券交易也会像股票交易一样普遍。
列表格解决问题,在列表的过程中,更能感觉到数学变化的趋势,慢慢地就会知道大约从多少开始试验,而不是永远从零开始。
只要通过一个问题掌握解决某类问题的解法,就能把成千上万的问题解决掉。
学会把具体问题抽象成模型时,才能解决更多更难的新问题。
在学习数学时,我们最需要做的,就是将生活中的某些问题,由自然语言翻译成数学语言,然后用相应的工具来解决。
今天学习数学,重要的是把实际问题变成数学问题,然后知道如何利用各种软件工具来解决,而不是花很多时间学一大堆无法举一反三的技巧。
大部分人老老实实学好数学的基本方法,理解其中的思维方式最重要,不要苦练解题技巧。需要技巧的时候,我们应该关于利用沃夫兰姆的大脑,不要自己傻推公式。
明明在现实世界的问题,而且在现实世界里也有答案,但是却无法直接得到,非要发明一个不存在的东西作为桥梁。一种是化学中的催化剂;另外一个就是父母吵架之后的“传话筒”孩子。最后是“虫洞”。
从更广义的角度讲,很多数学工具都是如此,它们并非我们这个世界存在的东西,而是完全由逻辑虚构出来的。
虚数除了解三次方程还有什么用?对于数学本身的影响;作为工具的作用;应用层面。
衡量一个人认知水平的一个方法,就是看他接受虚拟概念的能力有多强。
复数的出现,标志着人类对数的这个概念认识的进步,特别是从形象思维到抽象思维的进步。
很多人觉得数学越到后来越难学,就是没有突破思维的瓶颈。
复数的基础在现实世界里并不存在,但是建立在不存在的基础上的工具,却能解决实际问题。
庄子有句话:“夏虫不可以语于冰者,笃于时也。”
我们有有限的世界里得到的很多结论,放到无穷大的世界里,需要重新检验,有些能够成立,有些不成立。
相比浩瀚的宇宙和人类的知识体系,我们的认知可能就如同夏天的虫子,受限于我们的生活环境。
对计算机科学家们来讲,将一个算法从平方的复杂度降低到线性,这是捡西瓜的事情,将一个线性复杂度的算法再减小几倍,这是捡芝麻的事情。
在无穷大的世界里,部分可以完全和整体等价。
我们不能以有限的认知,去理解无限的事物,也不能把那些从很少的经验中得到的结论,放大后用于更大的场景。
无穷并非是一个静态的、具体的大数字,而是一个动态的、不断扩大的变化趋势。
当逻辑和我们的经验有矛盾时,要么我们的经验错了,要么看似正确的逻辑,本身可能有问题,因为有概念的缺失。
当我们把时间分为无穷多份之后,到后来,不仅每一份是一个无穷小量,而且无穷多个无穷小量加起来依然是无穷小。
当我们的头脑开始接受数的概念可以超出一个具体的数,而是一个趋势时,我们的思维就进步了。
牛顿给出一个结论,时间-距离曲线在各个点切钱的斜率,就是各个点的瞬间速度。
导数是微积分的基础。
导数这个概念的提出,把很多物理量之间的数学关系建立起来了。比如速度是位移曲线的导数,而另一个物理量加速度又是速度的导数。
没有导数的分析方法,人类只能体会变化,但体会不出加速变化。
贝克莱这个名字对熟悉哲学的人来讲是如雷贯耳,对非哲学专业的人来讲也未必陌生,因为他在中国哲学课中是“臭名昭著”的唯心主义哲学的代表人物,他的一句名言是“存在就是被感知”,在我们的课程中被批评和嘲笑。
贝克莱提出的问题看似很小,却引发了第二次数学危机,第一次是前面讲到的发现无理数造成的危机,危机的根据就在于牛顿那个时代的人在逻辑上讲不清楚无穷小是什么。
如果你认为它们是两个球,一个快一个慢,一磅的要拖 10 磅的后腿,那么它们就要比单独一个 10 磅的球落地慢。但是,如果你认为它们是一个整体,一共 11 磅,就要更快。
从人类的认知到静态或者宏观变化进入到把握瞬间动态变化和加速变化,这是人类认知的一大飞跃。
微积分是以导数为基础的,而无穷小又是导数的逻辑前提和基础。
牛顿认为极限是逐渐变小的量之间的最终比值。
莱布尼茨不是物理学家,他是数学家,更是哲学家和符号学家。因此他从逻辑的角度看待极限,他认为,如果任何一个连续变化都以一个极限为终结,那么在这个变化过程中普通规律,也适用于最终的极限。
极限是微积分里最重要的定义之一,对极限进行准确的定义要分两步。第一步是把概念搞清楚,没有二义性,这件事是柯西完成的。第二步就是用数学的语言将它们表述出来,这就有点反人性了。
要完美数学上的那些“漏洞”,就要引入新的概念,把原来数学的体系扩大为新的体系。
魏尔斯特拉超出前人和常人的地方有两个,一个是他定量地描述出无限的趋势,另一个是他用逆向思维让大家理解了这种趋势的含义。
不要指望一次就能完美地解决所有问题,我们的解决方案可能有漏洞,不要怕被别人指出来。当我们进一步弥补漏洞之后,我们的认知就再次升级。
x | 1 | 0.1 | 0.01 | 0.001 |
---|---|---|---|---|
f(x) | 1 | 0.1 | 0.01 | 0.001 |
g(x)正弦函数 | 0.8414 | 0.099833334 | 0.009999983 | 0.00099999983 |
g(x)的另类表述 | ≈1-0.16 | ≈0.1-0.000167 | ≈0.01-0.00000167 | ≈0.001-0.000000017 |
当一个无穷小量比另一个以更快的速度趋近于零,我们就说第一个比第二个更小。
我们按照各个函数往无穷大方向增长的速率,比快到慢给出了下面的一些例子:
- 指数函数 $10^x$
- 幂函数 $x^N$,通常 N=2, 3, 4…
- 自身 x
- 平方根 $\sqrt{x}$
- 立方根$\sqrt [3]{x}$
- 对数函数 $\lg x$
很多个低级阶无穷大,加在一起增长的速率都比不上一个高阶的。
计算算法所关心的事情,是当问题很大时,不同的算法的计算量以什么速度增长。
一个好的计算机从业者,他在考虑算法时,是在无穷大这一端,考虑计算量增长的趋势,一个平庸的从业者,则是对一个具体的问题,一个固定的 N,考虑计算量。
我通常喜欢用“博弈”这个词形容一个无穷大和一个无穷小相乘的情况,因为结果是什么,就看谁的阶高了。这就好比你和你的女朋友,彼此的激情随着苯基乙胺深度降低在不断减退,另一方面,亲情却随着内啡肽的浓度上升会逐渐稳定,最后是成功,还是分手,就是无穷大和无穷小趋势的博弈。
当我懂得了高等数学本质是对趋势的动态描述,是对各种相关性抽象的表述后,再回头看微积分,就觉得容易得不得了了。
我们常说“贫穷限制了想象力”,其实贫穷不会限制想象力,贫穷的人可以胡思乱想,但是他们在某一维度上的经验极少,以至于让人觉得是刘姥姥进大观园。
知道了自己的知识有穷尽,而未知世界无穷尽,反而会更接近真理,更容易提高自己的认知。
从初等数学到高等数学,就是要把看数学的眼光,从一个一个静态的数字、孤立的公式,上升到动态变化的趋势。
真正的大趋势,总是持续十几年甚至几十年,是不容易错过的,几十年复合增长下来,比任何投机获利都大,这就是对动态看世界的人的褒奖。
有人觉得数学好的会算账,遇事可以精明不吃亏。但是过分精明的结果就是眼睛都盯在了眼前的利益上,看不到长期的利益,这样反而不聪明了。
事实上,任何一个向上持续增长的趋势,假以时日,都能涨得很多很快。
人是特别善于创建虚拟概念的物种,我们今天的生活其实离不开各种虚拟物作为实体的媒介。
往无穷小变化的趋势和往无穷大变化的趋势如果相乘,最后是清零,是常数,还是不断放大,就看谁的阶高了。
逻辑可以帮助我们分析清楚我们看不到的事情,甚至不存在的事情。
将一件事情表述清楚非常重要,很多时候,我们需要通过彼此能够理解的形象的比喻来说明,这就如同我们在讲述极限这个概念时用“越来越接近”描述。
做事专业,就需要掌握专业的术语。
取得小成就要靠朋友帮忙,但是要取得惊人的成就,就需要一个理性的对手。
我们在工作中,对于那些理性的对手,即使不喜欢,我们也应该尊重他们的意见,因为那些看似不同的意见,恰恰是我们进步所需要的。
对科学家最大的褒赏是荣誉,因此今天科学空们争的是谁第一个发现某个规律,而不是保守秘密。
虽然我们说科学无国界,但是技术从来就是有国界的,不仅有国界,甚至有公司的边界。
对于一个人来讲,他需要搞清楚的,就是自己想要什么。
使用列表的方法解决鸡兔同笼的问题可以衍生到解决其他问题的方法,其次,学生们在列表的过程中,更感受到数学变化的趋势,慢慢地就会知道大约从多少开始试验,而不是永远从零开始。
只要通过一个问题掌握某个解法,就能把成千上万的问题解决掉。
学会把具体问题抽象成模型,才能解决更多更难的问题。
在学习数学时,我们最需要做的,就是将生活中的某些问题,由自然语言翻译为数学语言,然后用相应的工具来解决。
你可以说祖冲之的方法失传了,不过失传本身就投射出那些学问很难学。其实类似的情况举不胜举,古代东方文明经常是后人不如前人,很从研究都得一遍遍从来再来,这导致了科学研究在上千年的时间里原地踏步。
简单地讲,再难的数学题,都可以通过一个个定理,不断地被拆解成一些比较简单的问题,并最终被拆解为几个基本的公理,只要把那些小问题解决了,难题就解决了。
欧几里得几何公理:
1. 由任意一点到另外任意一点可以画直线(也称为直线公理);
2. 一条有限直线可以继续延长;
3. 以任意点为心,以任意的距离(半径)可以画圆(圆公理);
4. 凡直角都彼此相等(垂直公理);
5. 过直线外的一个点,可以做一条,而且仅可以做一条直线的平行线(平行公理)。至于平行线,就是平面上永不相交的两条线。
欧几里得构建公理化的几何学的过程是这样的:
- 首先,遇到一个具体的问题,要作相应的定义,比如什么是夹角;
- 其次,从定义和公理出发,得到相关的定理;
- 然后,再定义更多的概念,用公理和定理推导出更多的定理;
为了证明而虚构出来的东西,但是这些虚构的东西对证明实在的事情有帮助。
对于很多具体的问题,古代东方文明直接解决具体问题的做法或许行得通,但是问题和问题因为之间没有太强的逻辑关联,那些数学成就就无法形成体系,而且难以举一反三。
整个几何学的基础是十条非常简单的公理,它的发展依靠对新定理的发现和通过逻辑推理证明这些定理。
在几何学的发展过程中,除了欧几里得,他之前的数学家恩诺皮德斯起了很大的作用,后者明确提出了一般性问题和定理的区别,一般性问题解决得再多,对体系建立的帮助也不大,定理则不同,它们是搭建体系的基石。
作者分享的两点体会:首先是如何学习几何,它在在于多做多少题,做练习的目的是理解这个体系中每一个定理的来龙去脉,这样脑子里就有几何学的导图,遇到新的问题就可以用类化的方法解决;其次,在任何时候,除了那些客观的、被验证了的,或者不证自明的道理,我们作决定时,不要加上过多的主观假设。我们常说,未经审视的人生没有价值,其实未经逻辑检验的结论,价值也不大。
在数学史上,有两个人把几何学中的第五公理改了,然后依照逻辑,各自创立出一整套能够自洽的新的几何体系。第一个人叫做罗巴切夫斯基,他假定过直线外一个点,能够做该直线的任意多个平行线。第二个改变第五公理的人是著名数学家黎曼,他假定经过直线外任意一个点,一条平行线也做不出来,这样构建的几何学被称为黎曼几何。
在黎曼几何中,空间被扭曲成椭圆球的形状,这个空间每一个切面是椭圆,因此它也称为椭球空间。
黎曼希望在解决球面和其它曲面的问题时,最好有形式上比较简单一致的表述方式。
爱因斯坦的相应论,之所以采用黎曼几何这个工具,而不是欧区几何来描述广义相对论,是因为时空和物质是互相影响的,并不像牛顿为学里面所认为的时空是固定的。特别是在大质量星球的附近,空间被它的引力场弯曲了。
我觉得大家应该有这样一种理性眼光,就是我们习为为常的事情,在没有明确说明之前,大家的认同其实会有误解。
数学的美妙之处在于它的逻辑自洽性和系统之间的和谐性。
作为人,基本的设定没问题,活出自己的精彩是对社会的贡献。
在不同的应用场景中,有的工具好用,有的费劲,学数学关键是要学会在什么情况下,知道使用什么工具。
法国思想家和数学家笛卡尔首先想到用代数的方法解决几何学问题,为了纪念笛卡尔,解析几何也被称为笛卡尔几何。
到了笛卡尔的时代,情况就变了。开普勒已经提出了行星运行的三定律,这三个定律都是基于椭圆轨道的,而不是当初哥白尼和伽利略基于圆形辅道的。
笛卡尔并非因为看到苍蝇飞就灵机一动地发明了解析几何,而是在脑子里面先有构造解析几何体系的完整想法,并且很清楚如何将平面几何中的图形用代数的公式来描绘。
代数和几何被统一起来之后带来了很多好处。一方面,一些复杂的几何学问题可以变得容易。另一方面,解析几何也可以让很多原本看似抽象的代数问题变得很直观。
学好数学靠的是有一套系统性的方法,和能够帮助理解的工具。对于解方程来讲,解析几何就是理解它们含义的工具。
工具在宇宙中是不存在的,完全是笛卡尔等人根据之前的数学理论,按照逻辑凭空构建出来的。
学好数学,不是做很多超出自己理解能力的难题,而是把自己有理解理解的知识融会贯通起来。
解析不但承前,而且启后,在它的基础上出现微积分,笛卡尔也因此成为了牛顿据说的前面的巨人。
通过公理化系统建立起一个知识体系,体现出人类创建思想的最高水平。
今天人们谈起罗马,会说罗马人一共三次征服了世界,第一次是靠武力,第二次是靠拉丁语,而第三次则是靠罗马的法律体系,简称为罗马法。
经过从西塞罗到查士丁尼时期很多法学家的努力,他们为罗马法找到了最基本的根据。于是罗马法就脱胎换骨了,从此和古代文明中那些单纯反映统治者意愿的法律非常不同,成为了一种维持公平公正的系统性工具。
著名法学家亨利·梅因说:“我找不出任何理由,为什么罗马法律会优于印度法律,假使不是有‘自然法’理论给了它一种与众不同的优秀典型。“
法律是自然的力量,是明理之人的智慧和理性,也是衡量合法与非法的尺度。
法律乃是自然中固有的最高理性,它允许做应该做的事情,禁止相反的事情。
如果对比一下罗马法的体系和欧几里得的几何,就会发现它们的共性:都是建立在不证自明,而且符合自然原则的公理之上,通过自然的逻辑演绎创造出新的定理或者法律条文,并且在此基础之上不断扩展。这样的法律,就不会随着统治者的更换而改变,因此具有很强的生命力。
林肯:既然所有的直角都想法,那么为什么不能人人平等。
我在给企业家们讲的时总是讲,创始人的任务一个是招人,另一个是树立企业文化的基因,包括价值观和做事的原则方法。
如果我们把办公司看成是构建一个公理化的系统,那么创始人一开始确定的做事原则和价值观,就成为了企业立足的公理部分。
要练习从基本的假设,也就是我们所说的已知条件出发,采用逻辑客观地推导出结论。要把数学从单纯的脑力练习,变成掌握工具的练习。
数学上的极限是绝对的、明确的,生活中却未必。
费曼对一些物理学课本的批评,他的大意是这样的,那些看似严谨的定义,不过是用一些词解释另一些词,学生们就算把它们背得滚瓜烂熟,照样体会不了其中的含义。
函数的定义:首先,这些函数里面都有变量;第二,它们都有一种对应关系;第三,上述的对应关系,都必须是确定的;第四,函数所对应的关系可以通过数学的方法,或者其他方法算出来。
函数是一种特殊的对应关系,任何一个变量只能对应一个函数值,当一个变量对应了很多值,这样的对应关系就不是函数。
提出函数概念的人就是著名数学家莱布尼茨。他在研究微积分时,常常要确定曲线上每一个点的一些性质,比如它附近的点是否连续,或者曲线在这里的斜率是多少。
在中文里,“函数”这个词是清末数学家和翻译学李善兰创造出来的。
人对变量之间关系的感觉其实不准确,而函数帮我们弥补了这个先天不足。函数的第二个意义是让我们从对具体事件、具体数的关注,变成了对趋势的关注,而且可以非常准确地度量变化趋势所带来的差异。
很多人平时会对一件事过分敏感,要么因为一个好消息过分乐观,要么因为一个坏消息过分悲观,当我们对函数,而不是一个个具体的数有概念后,我们的见识就容易提高。
函数的第三个意义在于帮助我们通过学习几个例题,掌握解决一系列问题的方法。
其实上,最初设计计算机的目的,就是根据弹道的函数,计算远程炮弹轨迹的,当然,这个函数中不只有角度一个变量,炮弹的速度、空气的阻力和风向都是变量。
函数还为同一类问题提供了具有普遍性的答案。
自变量的取值范围或者限制范围,我们称之为函数的定义域。这里面的域,就是疆域的意思,它表明一个函数所描述的变化规律是有范围限制的。当一个函数的定义域确定之后,因变量,也就是函数值也受到了相应的限制。
很多人常犯的错误在于没有考虑定义域,滥用函数关系。
使用任何规律之前要看条件是否相符,不能错误套用公式。
函数的因果关系,有两点需要明确。首先:数学上的因果关系和生活中的可能不完全相同。当一个函数的变化由两个,或者更多的变量决定时,单个变量和函数之间的因果关系,并不是函数值变化的必然原因。
在一个函数中,自变量和因变量的角色是可以互换的。
在笛卡尔坐标系中,反函数的图和原函数的图就是相对 45 底角的对角线对称。
别看 2% 的差异不显大,如果我们把时间放大到 36 年,也就是一代人的时间,那么回报就是翻番三次和翻番四次的差异。因此一个人善于理财,还是不善于理财,到退休的时候,财富很容易差出一倍。
当一个函数的变化由两个,或者多个变量决定时,单个变量和函数之间的因果关系,并不是函数值变化的必然原因。
在生活中,很多人把正相关性、因果关系和必然性相混淆。
了解相关性和必然性的差别,能让我们少犯错误。
在生物体中,情况更加复杂。经济学上的很多指标好歹还是明确的正相关或者负相关,而生物上很多体征和指标,同我们要找的疾病、遗传,或者新陈代谢的相关性是非常模糊的。在这种情况下,我们把相关性误解为有因果关系的必然性,是非常危险的。
学术研究的主要目的,已经从过去那种寻找确定性,变成了挖掘尚未人知的,能影响结果的变量,并且寻找它们和结果之间的相关性。在研究某一个变量的影响时,我们通常要屏蔽其他变量的作用。
人文和社会学科与自然科学领域的特点完全不同,前者更像是江湖,学者们彼此很难相互说服,这其实非常准确地描述了学术界的特点。
今天的学术研究通常只能在几个维度研究相关性,因此对于研究的结论,我们要全面看待。
一个组织,必须形成合力,才能把事情做好,我们还说,一个人如果跑错了方向,再努力也没有用。
在这个世界上,对于大部分物理量和生活中遇到的数量,我们不仅需要关心数值的大小,还需要关心方向。
每次看到数字时就必须想一想,“是否考虑了方向?”否则我们还是停留在小学生对数字的理解程度。
在数学上,来描述带有方向的数字,这种工具被称为向量。类似的,那些只需要关心数值,不关心方向的数量也被称为标量。
要形成合力就必须方向一致,即便方向不能完全一样,彼此之间方向的夹角也需要尽可能地小。你往三个方向使劲,每一次努力其实都是有成本的,但是很多时间努力相互抵消掉了。
如果什么事情都想做,力量不仅分散,而且彼此会产生矛盾,作用就抵消了。即使没有太多矛盾,只要用力的方向不一致,效率就低。
不仅多个人合作会因为方向不一致会出问题,一个人自己努力,如果方向总是摇摆,也会出大问题,比如我们前面举的逃离爆破现场的例子中,方向来回换,特别是动不动拐大弯,其实最后是在兜圈子。
我们从毕达哥拉斯定理出发,建立了角度判定因子 Δ 和具体的关系,然后我们将这种关系称作余弦定理。
向量不仅可以对文章进行分类,而且还可以对人进行分类。
很多人觉得多写点东西没坏处,这种认识是错误的,这些画蛇添足的内容其实稀释了求职者的竞争力。
如果你在求职单位有熟人,不妨问问他们对某个职位的要求,然后根据这个要求写简历,这样在他们看中的维度你的得分就高,在他们根本不在意的维度,他也不需要强调。
微积分主要是训练我们的思维方式,而线性代数,大家在工作和生活中真的用得上。
把数字这么横平竖直地排列不是原因,而是结果,矩阵产生的原因是向量的扩展。
直到 1850 年矩阵才由英国数学家西尔维斯特(James Joseph Sylvester)发明,而构成它的向量其实出现的时间也很晚,是 1835 年才被提出来的。
今天在生活和工作中,经常需要有相对固定的大的原则,以及针对各种情况小的变动,这时候需要有一个相对固定的核心,再加上一个增量,而不是复制一大堆,拷贝以后逐一修改。
我们可以这样理解矩阵和向量的相乘,它是批处理解决问题的思路,而过去我们学的乘法和连加是单个解决问题的思路。
如果你想在投行找工作,用到最多的数学工具就是线性代数中的矩阵运算。
将单个计算变成大批量处理,这是我们今天在信息时代要有的思维方式。
自然界中很多数学问题并非线性的,但是我们在解决它们的时候经常将问题近似为线性的问题,这样可以利用很多线性代数的工具来解决。
学没学过微积分,思维方式会不同,眼中的世界也会有差别。
![[Pasted image 20241029071600.png]]
左边的图中,横轴是时间轴,纵轴是位移,那条曲线是位移随着时间变化的函数 S(t)。从 t0 开始的一段时间 Δt,以及相应的位移量 ΔS,它们构成一个直角三角形的两条直角边。位移量除以时间,就是斜边的斜率。
当时间间隔 Δt 逐渐变小时,这个比值会变化,会越来越反映出在 t0 点附近的速度。当 Δt 趋近于 0 时,那条反映速度的斜线,就是曲线在 t0 点的切线,牛顿就把到那个切线的斜率,定义为了在 t0 点的瞬间速度。用公式表示为 v(t0) = ΔS/Δt,当 Δt -> 0 时。
牛顿就从平均速度出发,定义了瞬间速度,也就是说,某个时刻的瞬间速度,是这个时刻附近一个无穷小的时间内的平均速度。
有了导数的概念之后,我们就可以准确地度量任意一个函数在某一个点的变化。因此导数的本质是对变化快慢的准确量化度量。
很多时候,我们总想全方位改进自己,但是人的精力和资源有限,因此在某一时刻,可能只能向一个方向努力。
事实上学习了梯度理论后,在任意时刻算出梯度,然后沿着最陡,但是收益最大的路径前进就好。
微积分给我们的第一个思维提升应时练习从宏观趋势中把握微观变化的趋势,让我们认清每一步的方向。
关于函数的可导性,记住一个简单的理论就可以:一个连续的、光滑的曲线就可导。因为函数曲线中的尖尖点是不可导之处,曲线光滑就不会有尖尖点。
导数在数学上更本质的意义,在于它是对于连续性的一种测试,光滑、连续的导数曲线,可以成为判断未来走势的依据。
在股市上,如果一家公司的业绩表现总是不平滑变化中,它的股价常常好不了,因为投资人无法预期它的表现。
导数的性质,很好地反映了问题变化的趋势。正是因为有这层关系,“向前看”的人通常更喜欢看一个函数导数的性质,而不是盯着总量。
不可导的趋势靠不住。
我们追求的目标是拿下光滑的变化趋势,而不是到处是奇点和不可导的尖点的情况。
我们可以讲距离是速度的积分,我们还讲过速度是距离变化的微分,由于可见微分和积分是互为可逆运算的。
事实上,速度是一个随着时间不断变化的函数,忽快忽慢,那么在这样的速度下走过的距离就需要考虑每一时刻的动态变化了,积分就是提供这样的工具。
积分的第二个意义就是从微观上每一时刻动态的变化理解宏观上积累的效果。
凡是需要通过积分获得的数量,它的结果会滞后于瞬间变化,有时还要经过相当长的时间滞后才能看到。
由积分获得的数量,一旦大到被大家都观察之后,要逆转这个趋势是非常难的。
速度比加速度有滞后,距离比速度有滞后。
你的能力积累一段时间,才会变成你的成绩和业绩;而你有一次好成绩,并不会马上得到领导的赏识和同事的认可,要经过一段时间,才会有赏识和认可,才能获得自身利益。
反过来也一样,当我们开始觉得自己了不起,停止努力时,你就会发现,一段时间后,能力就不适应新工作了,再过一段时间就会做砸几件事情,几次积累下来,在单位的处境就危险了。
人有一个很大的弱点就在于,他在开始努力的一瞬间,就指望能力马上提升,然后周围的人马上肯定自己,忘记了积累效应。如果别人不肯定他,他就觉得世界就他不公平。
牛顿的伟大之处在于,他不像前人那样,将最优化问题看成是若干数量比较大小的问题,而看成是研究函数动态变化趋势的问题。
牛顿在寻找最大值这件事情上,和前人不同的地方在于他不直接解决那些很难的问题,而是把比较数大小的问题,变成了寻找函数变化拐点的问题,后一个问题要比前一个好解决。将这两个问题等同起来,需要发明一种工具,叫做导数。
有了导数这个工具,求最大值问题就变成了解方程的问题。
一个函数可以有多个极大值,但是只能有一个最大值。
牛顿等人通过考察函数变化的趋势,发明了一种通过跟踪函数从低到高,再到平稳,最后再下降的变化,而求最大值的方法,这就让人类对事物一理解从静态,到动态了。
牛顿的贡献:第一个是有关加速度、速度和距离的关系;第二个是动量和动能,以及撞击力的关系(动量是动能的导数,撞击力是动量的层数);第三个是天体运行的向心加速度问题,它是速度的导数,而万有引力则是向心加速度的来源。
莱布尼茨除是数学家,还是一个哲学家和逻辑学家。他的哲学思想和逻辑思想概括起来有两点:首先,我们所有的概念都是由非常小的、简单的概念复合而成的,它们如同字母或者数字,形成了人类思维的基本单位;其次,简单的概念复合成复杂的概念的过得是计算。
在数学上,莱布尼茨不仅致力于微积分的研究,而且还发明了二进制,这样他给人类贡献了另一套便于计算的进制。此处,他还致力于改进机械计算机。
对于一项发明,简单追溯最早的发明人是没有意义的,而要看谁做出了具体的贡献。
1701 年,也就在双方就微积分的发明权开始论战后,当普鲁士国王腓特烈大帝询问对牛顿的看法时,莱布尼茨讲:“在从世界开始到牛顿生活的朝代的全部数学中,牛顿的工作超过了一半。”
事实上,莱布尼茨不是自然科学家,他的自然观基本上都是凭直觉产生的,用今天的话说有点反科学。但是,这并不妨碍他从逻辑出发,发明数学上最伟大的工具。
其实在任何重大发明的过程中,时间早可能远没有想象的重要。
很多人都醉心于从零到一的发明,但是真正伟大的发明需要走完成 0 到 N 的过程,这中间有很长的路,任何时候进入相关的领域都不晚。
打桥牌人基本上背下主要牌型分布的概率,在打牌时是靠概率趋势,而不是运气。
著名的启蒙学者伏尔泰是当时最精通数学的人之一,他算出了法国政府彩票的漏洞,找到了一些只赚不赔的买彩票的方法,赚了一辈子也花不完的钱。
在拉普拉斯之前,人们对“有可能”和“概率大”是分不清楚的。
每一种不可再分,都是单位事件。单位事件的概率称为原子概率。例如:两个骰子加起来是 5 点,即第一个骰子的点数是 1,2,3,4,第二个点数是 4,3,2,1。基于单位事件的概率,拉普拉斯定义了古典的概率公式:$P(A)=随机事件 A 中所包含的单位事件的数量\div随机变量空间里所有的单位事件的数量$
两个骰子的点数组合有 36 种,即当第一个骰子是 1 点时,第二个骰子为 1~6 点六种情况。
根据拉普拉斯对概率的定义,所有可能发生的情况放在一起,构成了一个随机事件总的集合。
所以两个骰子加起来为 5 点的概率是 1/9(包含了 4 个单位事件)。同理,总各为 2 点和 12 点的概率最小,是 1/36,中间 7 点的概率最大,是 1/6。因此这 11 种情况并不是等概率。
如果一个随机事件,包含了随机事件空间中所有的单位事件,那么这个事件必然会发生,它被称为必然事情,概率就是 1。
随机性是一种自然的属性,我们无法否认它的存在,它导致很多结果变得不确定。但是对于特定的随机试验,它得到什么结果,还是有规律可循的,于是数学家们用一个概念的概念来描述这种不确定性。虽然人类最初的动机和金钱相关,但是一旦掌握了不确定性背后的规律,就从自发状态进入了自由状态。
在一般情况下,出现 A 的概率是 p,B 的概率是 1-p。这类试验后来被称为拍努利试验。
![[Pasted image 20241107132038.png]]
抛 10 次硬币,虽然 5 次正面朝上的可能性最大,但是只有 1/4 左右。
有关不确定性的规律,只有在大量随机试验时才显现出来,当试验的次数不足,它则显现出偶然性和随意性。
方差其实是对误差的一种度量,既然是误差,就要有可对比的基点,在概率中,这个基准点就是数学期望值(简称期望值),也就是我们通常说的平均值。
有了方差的概念,我们就能定量分析“理想”和现实的差距了。什么是理想呢?我们进行 N 次拍努利试验,每一次事件 A 发生的概率为 p,N 次下来发生了 N*p 次,这就是理想。那什么是现实呢?由于标准差的影响,使得实际发生的次数严重偏离了 N*p,这就是现实。
越是小概率事件,你如果想确保它发生,需要试验的次数比理想的次数越要多得多。
提高单位成功率要远比多做试验更重要。
很多人喜欢赌小概率事件,觉得它成本低,大不了多来几次,其实由于误差的作用,要确保小概率事件发生,成本要比确保大概率事件的发生高得多。
凡事做好充足的准备,争取一次成功,这要远比不断尝试小概率事件靠谱得多。
很多人投资总是失败,判定一件事发生的可能性总是有很大的误差,一个重要的原因就是靠直觉和有严重漏洞的逻辑,而不是靠严密的数学逻辑和推导。
由于随机性的作用,我们在准备资源时,达到平均值还是不够的,需要准备一些冗余量。
池子越大,越能抵消随机性带来的误差。
对于个人来讲,应该优先考虑那些大保险公司投保。
如果一家公司只能靠零利率贷款才能生存,它本身就没有必要存在,因为它破坏了资源的有效性。
在法律上明确了数据的所有权之后,还需要有技术手段让数据在不损害所有权的情况下发挥作用。区域链可能会在这方面发挥巨大的作用,因为区块链可以防止数据无成本地被拷贝复制。世界上任何能够拷贝的东西都没有价值,而越是稀缺的越有价值。
数据要想成为资产,就要做到不能够被随便被复制。
解决数据被随意拷贝的问题,要堵住两个源头,一个是监守自盗,一个是外贼入侵。
最初对这个问题有深刻理解的是 Google 前 CEO 施密特,他在 2014 年就指出:”区块链是一项了不起的加密成就,它能创建数字世界中不可复制的内容,具有巨大的价值。“
区块链对此也已经给出了解决方案,就是它能够做到验证、使用数据和拥有数据分开。
将数据资产化,进而资本化,对数据的所有者、管理者和使用者,都会产生巨大的收益。
高斯对正态分布的误差(也就是标准差∑)做也更严格的分析,于是正态分布今天就被命名为高斯分布。
发明的荣誉常常是授予最后一个发明者,高斯分布也是如此,因为是高斯为这项发明画了句号。
如果一个随机变量的取值符合高斯分布,它有大约 68% 的可能性,动态范围不超过平均值加减标准差∑。
这个规则适合于任何高斯分布,我们通常称之为”三∑原则“或者”68-95-99.7原则“。
![[Pasted image 20241122153702.png]]
图中曲线和 x 轴之间的面积,就是曲线的积分,面积的大小就代表了高斯分布在某个范围内的概率。
事实说明,我们对于大概率事件,往往是视而不见的,有风险其实就存在其间,有以下三个结论:
- 股市的风险要远远高于大部分人的想象
- 由于任何一种投资都有标准差(风险),因为对比投资回报时要把它考虑进去,不能只考虑回报不考虑风险
- 如果有一只股票连续三年的回报是 10%,另一只只有 5%,你能说第一只比第二只好吗?不能,因为 5% 的差异,要远比 16% 的标准差小得多,事实上个股的方差比股指更大。
不要以为自己的投资回报在几年里超过股市大盘,就觉得自己是股神。
由于偶然性的存在,如果只有很小的均值差异,那可能说明不了什么问题。
对于几乎所有的随机事件来讲,条件概率由于条件的存在,它通常不等于本身的概率。
很多人学习别人的经验,用到自己身上就不灵了,原因就是没有搞清楚条件。另一方面,有些原来大家认为不可能做成的事情,一旦条件具备,就成了大概率事件。
条件概率公式 $P(Y|X)=P(X,Y)/P(X)$ 。一件事 Y 在条件 X 下发生的条件概率 $P(Y|X)$,等于条件 X,和这件事 Y 一同发生的联合概率$P(X,Y)$,除以条件 X 的概率 $P(X)$。
在数学上的因果关系不像在物理上是单方向的,它可以是条件和结果互为因果。在概率上也有这个特点,就是条件和结果可以互换。
很多人将自动翻译想象成语言学问题,其实这是一个数学问题,或者更准确地说,是一个概率问题。
前苏联伟大的数学家柯尔莫洛夫,他完成了概率论的公理化过程,因此很多数学家觉得他是 20 世纪最伟大的数学家。
为了弥补拉普拉斯古典概率论的漏洞,英国的逻辑家约翰·维恩和奥地利数学家理查德·冯·米泽斯提出建立在统计基础上的统计概率。这就回避了所谓的等可能性的单位事件存在性的问题。
这就如同我们说,0.99999……无限循环下去等于 1,置信度是 100%,因为它们本质是一回事。但是 0.99999……再增加,它和 2 之间的误差还是无法弥补,因为它们根本不是一回事。
柯尔莫洛夫在 22 岁的时候(1925年)就发表了概率论领域的第一篇论文,30 岁出版了《概率论基础》一书,将概率论建立在严格的公理基础上,从此概率论正式成为了一个严格的数学分支。
概率函数需要满足下面三个公理:
- 任何事情的概率是在 0 和 1 之间(包含 0 和 1)的一个实数;
- 样本空间的概率为 1,比如掷骰子,那么从 1 点朝上,到 6 点朝上加在一起构成样本空间,这六种情况放到一起的概率为 1;
- 如果两个随机事件 A 和 B 是互斥的,也就是说 A 发生的话 B 一定不会发生,那么,这件事发生的概率,就是 A 单独发生的概率,加上 B 单独发生的概率。这也被称为互斥事件的加法法则。
概率论从一个根据经验总结出来的应用工具,变成了一个在逻辑上非常严密的数学分支。它的三个公理非常直观,而且和我们现实的世界完全吻合。
统计学严格来讲是一门独立的科学,它是关于收集、分析、解释、陈述数据的科学。
在统计学中,还专门有一个分支,叫做描述统计学,就是研究如何让统计的结果更有说服力。
统计学研究的目的,通常是从大量数据寻找规律性,不同因素之间的相关性,以及可能存在的因果关系。
我们知道,今天使用大数据,主要是为了寻找一些变量之间的关联性,从而达到准确预测的目的。
虽然今天数据量不再是问题,但如何选定可能有关联的变量,则体现了人类的智慧。
霍桑效应:当被观察者知道自己成为被观察对象而改变行为倾向的反应。
今天很多推荐系统见你读什么,买什么,就继续推荐什么,但你一点兴趣也没有,这就是陷入了霍桑效应的陷阱。
今天看似大数据的数量量是足够的,但是如果你把它分为很多维度,其实还是很稀疏的。
想用数据的五个步骤:
- 设立研究目标:有了目标,才能避免盲目使用数据的情况,并且能够有意识地过滤数据中的噪音;
- 设计实验,选取数据;
- 根据实验方案进行统计和实验,分析方差;
- 通过分析进一步了解数据,提出新假说;
- 使用研究结果。
通常要获得 95% 以上的置信度的统计结果,需要被统计的对象出现上千次,但是如果整个样本只有几千字,被统计的对象能出现几次就不错了,这样得到的数据可能和真实的概率相差很远。
我们有两个方法:古德·图灵折扣估计法,它主要解决一种被称为零概率的事件。第二种叫插值法,最初解决这个问题的是贾里尼克,他发明了一种被称为“删除插值”的方法。
后来人们发现,语言的演变,恰恰是靠过去认为不可能的组合使用起来所驱动的,比如说今天的很多网络用语过去根本不存在。当它第一次出现时,你不应该将它的概率设置为零。
事实上,将小概率事件的概率强制设定为零,结果就是早晚会遇到黑天鹅事件。
80% 的问题常常由 20% 的高频元素构成的。反过来,80% 低频率的元素,或者说长尾的元素,只构成 20% 的总量。
齐普夫(George Kingsley Zipf)是美国 20 世纪初的语言学家,他经过对各种语言中词频的统计发现,一个词的排位,和它的词频的乘积,近乎是一个常数。
今天,齐普夫定律被认为是自然办的普遍规律。我们每一个人都需要牢记齐普夫定律,这样就不会相信所有人能够通过创业成为富翁这样的鸡汤观点了,因为它违背齐普夫定律。
贾里尼克讲,我把条件概率和非条件概率加起来,得到一个新的概率。当然在相加之前,要分别给这两个概率权重。比如条件概率的权重是 0.7,非条件概率的权重是 0.3。
插值法的精髓在于,相信那些见过次数比较多的统计结果,如果遇到统计数量不足时,就设法找到一个可靠的统计结果来近似。
很多时候,我们需要像古德那样预防不测,当然凡事都有成本,预防不测的成本在于要降低一些高收益项目的利润。同时,我们也要像贾里尼克那样,永远更多地依赖可靠的统计结果。
博弈论也被对策论。从它的名称你能猜想到,它应该是研究在竞争中采用什么的好的策略的理论,但是从本质上讲,它是一套解决最优问题的方法。
博弈论通常被认为是冯·诺依曼发明的。他被认为是比同时代的爱因斯坦还聪明的天才。
具体到博弈这件事,特别是计算机博弈,最通常的策略是,在“对方给我们造成最糟糕的局面里,选择相对最好的”。在计算机算法中,这种策略被称为最小值中的最大值策略。
在两方的博弈中,大家其中就是在寻找马鞍点这样一个平衡点,因为大家知道,如果自己走出这个平衡点,试图扩大自己的利益,对方就会有反制手段,让自己的利益受损。
当参与方的水平势均力敌,不相上下时,很多时候寻找最小值中的最大值是才是好的策略,或者说其实双方必须会被锁死在那个平衡点上。
在静态博弈中有一个非常有趣的情况,那就是双方都知道对方采用各种策略的可能性,这时双方要重新计算平衡点,而这个平衡点和矩阵中的马鞍点未必相同。
对我们来讲,最好的情况是,前面有几个人做失败了,而我们临危受命成功了。
开始的时候失败率高,太晚的时候已经没有了机会。
由于非零和博弈的平衡点问题最早是被纳什解决的,因此它也被称为“纳什均衡点”,它就相当于我们上一讲在零和博弈中讲到的马鞍点。在这种非零和博弈难题中,找到纳什均衡点就是最安全的解决办法。
双赢点是大家主观上想达成的目标,但是现实中客观的结局常常是纳什均衡点,也就是双输的结果。
如何用好博弈论?
- 找好你博弈的对象,这里我说的博弈更多的合作,不是竞争;
- 永远不要玩难以达到双赢的游戏,因为出来混总是要还的,人不可能永远在零和博弈中占别人的便宜。
因为轻易破坏自己的原则,就如同破坏几何学公理一样问题严重。
因为如果小企业投入大量资金得到新技术,而大企业也享用技术并利用体量优势竞争,小企业就要垮台。
制定最好的策略,是要考虑到对方采用每一种策略的概率,而不是简单考虑对方一定会采用对自己最不利的策略。
在数学中,一个序列收敛,是指它最后会趋向一个有限的数字,这个有限的数学是客观存在的。在概率论中,显然这个数是局部和整体的比值,在 0 到 1 之间,既然存在这样一个数,我们就可以用这个数作为相应的随机事件的概率。
一个数学的分支,其基础一旦建立起来,就几乎不会改变了。
在认知层面,笛卡尔回答了两个问题,首先是人是如何获得知识的,其次是人能否通过自身努力获得知识。
靠经验的积累有两大问题,一个是来得太慢,这还不是最要命的,更糟糕的是直接经验常常是可靠的。
笛卡尔的贡献在于,告诉人类要通过理性过滤直接经验,然后才能获得知识。
第一个层面的是今天所谓的实证,第二个层面是理性,就是要用符合逻辑的数学的方法。
笛卡尔在哲学上的另一大贡献在于他肯定了人生而具有理性,并且有能力利用逻辑进行推理。
亚当·斯密把这个假设又推广到了经济学领域,它最基础的假设就是,人能够通过计算和推理,清楚自己的利益所在。
从世界的离散性假设,利用数学上的逻辑,莱布尼茨得到很多有趣的结论。他的这些思想启发人们发明了离散数学和量子力学。
精炼我们的推理的唯一方式就是使用它们同数学一样切实,这样我们能一眼就找出我们的错误,并且在人们有争议的时候,我们可以简单地说,让我们计算,而无须进一步地忙乱,就能看出谁是正确的。
套用《西方哲学史》一书的作者罗素的观点,整个德国古典哲学,就是试图构建位于科学和其他知识之上的大一统体系,形成一个没有矛盾的知识体系。
对于一个平庸的数学家,思考不思考哲学问题影响不大,反正从事的都是补足数学中知识点的工作,并不需要进行高层次的创作与研究。
如果我们仅仅像古希腊奴隶那样为了谋生而学习,掌握一点技能也就够了。但是如果我们是像苏格拉底那样把自己看成主人,以这个态度来学习,来做事情,我们就需要在认知层面有所提高,了解数学和哲学都可以帮助我们做到这一点。
无用之用,方为大用。一个人只有在深刻理解了人类知识的普遍性原理之后,才能站在一个制高点往下俯视,这也是数学和哲学的共同之处。
一种科学只有在成功地运用数学时,才算达到了真正完善的地步。
后来到了 19 世纪,英国人才把那种采用实验的方法,系统地构造和组织知识,解释和预测自然的学问称为科学。
什么产业一旦利用互联网进行改造,就会使得效率倍增。自然科学各个学科的形成和发展,其实就是一个“+数学”的过程。
伽利略的伟大之处在于,他把数学方法和实验方法结合起来研究自然界的现象,使物理摆脱了经院哲学的束缚。杨振宁说,数学和物理是两片生成在同一根管茎上的叶子,这非常形象化地说明了数学与物理之间的关系。
在牛顿之后,最重要的物理学家是麦克斯韦,他对电磁学的贡献,堪比牛顿在经典力学上的贡献。
麦克斯韦的理论了不起的地方在于他预见到了当时大家还观察不到的现象,比如他在数学上推导出电磁波的方程式,预测出电磁波的存在,而电磁波在真空中的速度与当时所知的光速相近,因此他预测光也是一种电磁波,只是可见频谱波段特殊的电磁波而已。
对于麦克斯韦的贡献,赫兹是这样说的:“我们不得不承认,这些数学公式不是完全人造的,它们本身是有智慧的,它们比我们还聪明,甚至比发现者更聪明,我们从这些公式所得到的,比当初放到这些公式中的还多”。
拉瓦锡的贡献是提出了氧化学说,推翻了过去的燃素说,这个成就来自于逻辑的判断。
拉瓦锡说:“没有天平就没有真理”。
数学作为工具很容易理解,比如微积分是今天很多自然科学研究的基础,离散数学是计算科学的基础,而这在物理学中特别明显。
养成理性和量化地处理我们日常工作的习惯,建立和他人的沟通基础,是通识课的一个目的。
一般认为,逻辑是人类理性的表现,它的基础原理其实都是大白话,但是仔细琢磨起来很有道理,更关键的是,只有少数人能够坚持那些看似大白话的基本原理。
其实在第一次粗心的背后,都有概念不熟悉的深层次原因。具体到这个问题,就是根本不理解同一律。
自己不懂的逻辑,头脑不清,讲出的话违反了同一律,就会造成别人的误解,甚至自己也会被绕进去,很多人缺乏好的沟通能力,可以溯源到讲话经常违反同一侓上。
在生活中,我和别人沟通时,我常常会用我的语言复述一下对方的话,明确我们是在讨论同一件事情,这一点很重要。很多时候,我们和别人沟通中的误解,就来源于忽视了同一律。
光的波料二象性是否违反矛盾律?这其实不违反,因为它讲的是一个事物的不同方面。
逻辑学家们一般强调四个“同一”,即同一时间、同一方面、同一属性、同一对象,总之强调的独一无二的事件。
阿佩尔和哈肯的高明之处在于,他们用计算机穷举了所有的情况,然后借助计算一一证明了各种情况。而这种证明方法的正确性,是靠排中律保障的。
充分条件律成立的原因,在于宇宙中任何事物不能自我解释,或者说不依赖于其他事物而存在。
数学正是因为有内在的逻辑性,才避免了可能的自相矛盾之处。
人们通常会身陷矛盾而不自知,因为缺乏逻辑性。人们有时也会对某个重要的事物想不清楚,不知道该如何作判断,其实运用逻辑,把事实分析一遍,真相就清楚了。
我们想要缩短整个的生产时间,就需要缩短关键路径上的时间,这就是运筹学的思想。
运筹还其实就是利用图论、线性代数等数学工具,从整体上改进现有系统的效率。
刘润老师和我发现,一个企业最重要的是它的愿景和使命,价值和文化。一个卓越的企业在这些方面做得很好,相反一个平庸的企业可能到关门都没有考虑清楚这些问题。
如果一个企业形成制度,没有明确的市场定位,做事情没有章法可循,什么事情都要具体分析,需要靠创始人或者 CEO 的权力来解决,这样的企业就整天忙着救火,事情还做不好。
三个公理一旦确定,公司的基因也就定了,发展也就不同了。
历史学研究中,不强调所谓的正确性或者正统观点,而强调逻辑的自洽。任何从客观出发,逻辑上能自洽的结论都是有意义的。
在历史学研究中,不会像数学那样有对有错,但是却会有好有坏,有合理和荒诞的分别。而评判的标准就是其假设前提,也就是公理的客观性,以及论证的逻辑性。
如果我们在数学内划定一个区域,这个区域里很可能出现仅仅依靠区域内的知识无法解决的问题。
伽罗瓦其实是发明一套新的工具,这样一劳永逸地解决了很多问题。因此,学习工具,善用工具,是学好数学的秘诀,也是我们平时做其他事情需要具有的能力。
在一个时代,某些问题之所以显得很难,是因为它们看似属于当时和知识体系中的问题,但其实这只是表象。
庞加莱猜想在我们看来显然是正确的,但是在数学上,只有公理是显然的,其他任何结论都需要经过证明得出,有些时候,越是显然的结论越难证明。
黎曼猜想的主题是研究素数分布的问题,这对我们的加密有很大的意义。
我们能够理解一个真正的数学家所追求的目标是什么,在他身上体现出人类对未知的好奇和探索精神。
皮亚诺公理:
- 即 0 的定义;
- 任何自然数,都有一个后续的自然数;
- 0 不是任何自然数的后续自然数;
- 如果 b 和 c 都是 a 的后续自然数,那么 b = c;
人们从自然数出发,可以定义出包括负数的整数以及有理数,然后再从有理数出发,定义了实数,最后从实数出发,又定义出包括虚数的复数。
学习数学的思维方式:
- 不轻易相信没有根据的结论,一切要从公理出发,用逻辑得到结论;
- 在解决问题之前先要搞清楚问题,特别是搞清楚问题的定义;
- 各种知识体系是相通的;
- 用动态、发展的眼光看待世界。
你能读懂一篇科学论文,理解作者的本意,而不是字面意思,说明能理解他了。类似的,你能读懂一道数学题,说明理解出题人的意思了。很多人高考考不好,托福、雅思考不好,都是因为不理解对方。
从数学上讲,所有的加密货币之所以能够流通,而且不被破解,靠的是数学上一种不对称的美。
对于信息安全来讲,完全透明、完全对称会带来很多安全隐患。
要想保护私有信息,特别是隐私,必须有一套不对称的机制,做到在特定授权的情况下,不需要拥有信息也能使用信息,在不授予访问信息的权限时,也能验证信息。
比特币的意义在于,它证实了我们可以通过加密和授权,兼顾保护信息不被外泄,而且某些得到授权的人还能使用信息。
比特币的协议:采用一种被称为椭圆曲线加密的方法,相比目前比较流行的 RSQ 加密算法,采用椭圆加密方法可以用更短的密钥达到相当或更好的加密效果。
这种不对称性使得验证结果非常容易,但是想破解密码却难上加难。
只要数学上的这种非对称性存在,加密就是安全的。
施密特了不起的地方在于,能够在延续 Google 早期文化的同时,对 Google 进行规范化的改造,让那些通过个人的偶然性的成功,变成了必然性的结果。
施密特也是最先倡导 Google 向移动互联网转型的人,我记得早在 2004 年,他就预言将来移动互联网的流量将超过 PC 机互联网。
坎贝尔的管理思想和人才培养方式概括起来有四个特色:
- 强调在 IT 企业里规范管理的必要性;
- 强调 IT 企业管理和传统工业企业的差异;
- 强调服务型管理;
- 强调管理者自身的提高和工作效率;
世界上有两种富翁,一种是愁眉苦脸的,另一种是吹着口哨的。他们的差别不在于口袋里钱的多少,而在于天性是否快乐。