无处不在的Linear Logic

Linear Logic

定义参见wiki。

通常的逻辑描述的是真理(信息)。

比如，我们知道了万有引力，就可以推断出苹果成熟后会落地。之后我们同时拥有关于“万有引力”和“苹果成熟后会落地”的信息。

而Linear Logic描述的是资源。

比如，我有一块钱，然后一块钱可以买一个包子。我买了包子之后，手里就只有一个包子，原来的一块钱就没有了。

并行计算

之前做过一段时间并行计算的研究，在知乎上有个相关的回答。

能否并行计算跟问题域相关性非常大。

首先是看客户在乎吞吐量还是时延？

现在最常用的并行计算方式是SIMD，说白了就是堆硬件。比如一个计算任务，单核要算4个小时。现在绝大部分的并行计算，其实并不是说给4个cpu核，就能把时间压缩到1个小时。而是同样需要4个小时才能出结果，但是一下给出4个结果（4个核分配不同的计算任务）。

如果客户对时延不敏感，那就没关系，反正两种方式都是4个小时完成4个任务。这种情况下SIMD可能还更好一些，因为程序中不可避免会有一些串行的部分，根据阿姆达尔定律不可能做到4倍的加速比，所以4核并行的时候，一般1个任务的时间比1个小时要多一些。

当然这里有个限制，多个任务之间不存在数据依赖。

以上方案可以看到，并不需要程序做什么改变，完全是运维工程师的事情。

如果不满足以上条件，那就要程序支持并发。

如前所述，我们就需要深入到程序内部，区分哪些步骤可以SIMD，哪些不行。不行的部分又要仔细分析数据依赖，看是否有小的子任务可以安排到不同核上同时计算。

基本上是子任务拆的越细，并行度就会更高。当然最细力度的指令级并行CPU本身已经做的很好了，程序员只要关注任务级别就可以了。

这样整个工作就变成大量子任务的调度，优化就有点像小学课本上介绍过的运筹学。

烧烤架每次只能烤两串肉，一串肉需要烤两面，而每一面需要烤10分钟。那么考三串需要多少时间呢？

我们将三串肉串分别记为A、B、C，每串肉两面记为1、2，第一次烤肉时先烤A1和B1，用时10分钟；第二次时拿出B串，烤A2和C1，同样用时10分钟，此时A串已经烤熟；第三次烤B2和C2，再用10分钟。这样一来，仅用了30分钟，三串肉便都可以烤熟了。

从这个例子我们就可以看到，也是将烤一串肉这个任务拆分成两个子任务（每个烤一面）。

通常这时子任务的数量比执行器要多，所以关键就是保证执行器的利用率尽量高。

上面例子中的最优解里烧烤架的利用率是100%。如果按照最直接的方案，先烤A和B，然后再烤C，整个过程中烧烤架的利用率只有75%（后面单烤C的时候，有一半是空闲的），整体耗时也相应变成40分钟。

在拆分子任务的过程中，问题的表达方式起到很重要的作用。

就像前面知乎回答里面的并行加法器的例子，比较小的自然数相加看似无法拆分成更小的子任务，但是把自然数表达成二元组之后，就可以了。

在执行器利用率方面，我们可以把执行器的使用时间当作一种资源，这就可以用到Linear Logic了。表达清楚所有计算资源在各个时间段里的归属情况，各种数据的声明周期，有利于更高效的调度。

另外一种提高执行器利用率的方法是减少重复计算。

比如算一个数八次方的函数：f(x) = x * x * x * x * x * x * x * x

给出 x = 2 之后，普通的计算方式就是把x乘8次。但是这不是最优的计算方式，最优的计算方式只需要三次运算：

tmp = square(x)
tmp1 = square(tmp)
result = square(tmp1)

通过linear logic的限制(变量只能用一次)，可以强迫用户写出最高效的代码。

这在纯的函数式编程语言里面特别重要，因为纯的函数编程语言里面难以表达状态，通常有大量的重复计算，所以在相应的优化技术里面，基于linear logic的优化技术非常重要。参考《The optimal implementation of functional programming languages》。

所以我们看到linear logic是反抽象的。

linux的调度系统给每个进程都营造一种当前进程独占一个cpu的错觉。但是为了高效的并行，我们要打破这种错觉，让程序感知到真实的执行器的数量以及具体的使用率。

人的思维有个定势，在解题的时候总觉得把前提条件都用上才行。但是有的时候，限制一下前提条件，反而会催生出更高效的解决方案。

之前有个实验。给第一组的小朋友两根绳子和两块木板，让他们在脚不能沾地的情况下从房间的一头移动到另外一头。小朋友的方案是用两根绳子把两块木板绑在两只脚上，然后走过去。第二组小朋友只给一根绳子和一块木板。小朋友的解决方案是把绳子一头绑在木板上，一头拉在手里，然后两只脚都站在木板上。两脚同时往前跳的同时，手拉动绳子，带动木板也往前走。第二组用时反而比第一组更少。

但是在没有限制的前提下，能想到后一种方案是非常反直觉的。

这就像做选择题，不定项选择题比单选题的难度大了很多很多。

内存管理

之前也研究过一段时间的GC算法，在知乎也有相关的答案。

内存管理也与linear logic有关系。如果程序严格遵循linear logic，一个变量只能使用一次，那么就可以不需要GC，实现静态的内存管理。

初看起来，一个变量只能使用一次，那不是会导致程序里的变量更多，使用更多内存吗？

例如，先设定x = 1，然后不能直接改x = x + 1，必须写成x1 = x + 1。

但是一个变量只能使用一次，意味着变量使用之后，其内存就不会再被使用了。这时完全可以不做内存回收和再次分配的动作，直接复用原有的内存。这样上面新的变量x1其实用的就是之前x的内存，甚至编译器优化之后就是x = x + 1这样的代码。

Rust

Rust的OwnerShip系统的思想源自Linear logic。

关于这点，我专门问过核心团队的人，他们没有确认，但是我觉得很明显在思路上是有影响的，可能真正工程化的时候没有那么的重要。

就像一开始举的例子，linear logic里的对象都只能严格的使用一次，这就对应Rust的Move语义。

但是linear logic里也可以描述可以可以重复使用的对象，被称为exponentials，写作!A。在Rust中对应实现了Copy和Clone的Struct。

可以认为！A就像一个无穷无尽的水龙头，任何需要的时候，都可以从它那里获取一个A类型的对象。

所以在理论上，实现了Copy或者Clone的一个Struct A和没有实现Copy或者Clone的Struct A是完全不同的两个东西。前者是!A，后者就是A。

但是实际使用的时候，很少有把这个特性使用起来的。比如像我们自己的项目中，几乎所有的Struct都直接或者间接的实现了Copy和Clone。

我觉得可能是因为Rust目前主要用在服务器后台，其场景中大部分都是信息类的对象，比如登录用户信息等，很少有资源类的对象。

如果有相关场景，或者说我们应该尽量去创造相应的场景，把这个特性使用起来。可以参见The Pain Of Real Linear Types in Rust。

关于Rust，我一直有一个问题，就是linear type（Ownership系统）是否妨碍了Rust的表达能力？

Idiomatic monads in Rust这篇文章里有点相关的内容。

简单来说还是上面的结论，linear logic是反抽象的。

比如Rust为了支持Ownership，函数有三种类型：Fn, FnMut or FnOnce。

而且Monad的基础定义就不符合linear logic关于资源使用的限制。

因此实现Monad等非常抽象的结构时，困难重重。

区块链

《Linear Types Can Change the Blockchain》这篇论文讲述了linear logic与Blockchain的关系。

对于Bitcoin来说，签名就是所有权的证明，交易是资产转移的证明。

我们可以把具有相关性的交易串起来，形成多条子链，多条子链组合成一条大的链。

子链组合的时候其复杂度不是相加的，而是相乘的。

比如git里的rebase操作。在master上拉出一个分支fix，之后master上提交了3个commit，fix分支上也提交了3个commit。那么在rebase的时候最坏情况下要解决多少次冲突呢？答案不是6次，而是9次，即每两个commit之间都要检测一下是否冲突。

组合的过程中还要保证依赖的一致性，并解决不确定性（不相关的交易的顺序有多种排列方式都不影响一致性），而这就是POW的作用。

区块链里还有一个热门话题是交易并行。

就如前面讨论过的，最简单的方式是没有数据依赖，可以直接SIMD解决。

对应到以太坊里面，就是简单的分区，分片，更简单的是限制跨合约调用，这样就可以按调用的合约地址将交易分类，并行执行。缺点是跨分区的交易不好处理，对用户使用有限制。

第二种方案是确定性的并行。其实交易是可以并行执行的，哪怕有数据依赖，更严重的问题是并行执行导致的不确定性。区块链上合约执行是不能有确定性问题的，否则就分叉了。

有些方案是出块节点先把一个块内的交易执行一遍，在有数据依赖的时候，记录一下交易的执行顺序。然后把这个依赖顺序图随着块一起广播并共识。其他节点执行的时候按照一样的顺序执行，这样结果就是一致的了。

这个方案的问题，一个是需要先执行一遍，这样加速比会打一个折扣；另一个是用户无法预估执行结果，相当于在所有可能的结果里面随意挑选一个，这会给用户带来很大的困扰。

后来发现了一个受到以太坊资助的项目，设计了一个新的智能合约编程语言。特点是，执行速度最优，可以并行执行，具有形式化验证的能力。

这个语言底层计算模型就跟现有的语言完全不一样，使用SIC作为计算模型。SIC是linear logic的proof net模型的一个变种。

并行执行的特点来源于linear logic在使用proof net作为计算模型计算的时候，有强汇聚性。强汇聚性，就像我们前面提到的git的例子，多个commit合并的时候，类型系统保证一定不会有冲突。

但是这里的并行并不是在交易层面的并行，更像是CPU里面微观层面的并行，并行度由代码里面的数据依赖情况而定。

最后是关于合约编程模型的。

前面关于Account Model和UTXO Model的系列文章中，我们分别将其对应到Monad和Arrow。

但是这两种计算模型都是不满足linear logic的，并不能体现出区块链中合约操作的对象是有ownership且只能使用一次这些特性。

而且前面文章中提到的两个Model最主要一点区别是UTXO Model可以不用明确input和ouput之间的路径。这个特点其实在logic programming中也是存在的。

另外linear logic可以强制保持系统的不变量，Libra的resource type就是这样的思路。

因此后续合约编程模型会考虑将linear logic也集成进去。

为什么叫linear

为什么linear logic叫linear？是因为其语义跟线性空间非常相关。

一是前面提到过的，组合的时候张量积，这跟线性空间是一样的。

二是linear logic描述的是对象在状态空间中的移动。而线性代数其实也是描述物体运动的，参见孟岩的系列文章。