内存安全

Rust推崇安全与速度至上,它没有垃圾回收机制,却成功实现了内存安全 (memory safety)。

所有权

在Rust中,所有权 (ownership) 系统是零成本抽象 (zero-cost abstraction) 的一个主要例子。 对所有权的分析是在编译阶段就完成的,并不带来任何运行时成本 (run-time cost)。 默认情况下,Rust是在栈 (stack) 上分配内存,对栈上空间变量的再赋值都是复制的。 如果要在堆 (heap) 中分配,必须使用盒子来构造:

let x = Box::new(5);

其中Box::new()创建了一个Box<i32>来存储整数5,此时变量x具有该盒子的所有权。 当x退出代码块的作用域时,它所分配的内存资源将随之释放,这是编译器自动完成的。

考虑下面这段代码:

fn main() {
    let x = Box::new(5);

    add_one(x);

    println!("{}", x);
}

fn add_one(mut num: Box<i32>) {
    *num += 1;
}

调用add_one()时,变量x的所有权也转移 (move) 给了变量num。 当所有权转移时,可变性可以从不可变变成可变的。函数完成后, num占有的内存将自动释放。当println!再次使用已经没有所有权的变量x时, 编译器就会报错。一种可行的解决办法是修改add_one()函数使其返回Box, 把所有权再转移回来。更好的做法是引入所有权借用 (borrowing)。

借用

在Rust中,所有权的借用是通过引用&来实现的:

fn main() {
    let mut x = 5;

    add_one(&mut x);

    println!("{}", x);
}

fn add_one(num: &mut i32) {
    *num += 1;
}

调用add_one()时,变量x把它的所有权以可变引用借给了变量num。函数完成后, num又把所有权还给了x。如果是以不可变引用借出,则借用者只能读而不能改。

有几点是需要特别注意的:

  • 变量、函数、闭包以及结构体都可以成为借用者。
  • 一个资源只能有一个所有者,但是可以有多个借用者。
  • 资源一旦以可变借出,所有者就不能再访问资源,也不能再借给其它绑定。
  • 资源一旦以不可变借出,所有者就不能再改变资源,也不能再以可变的形式借出, 但可以以不可变的形式继续借出。

生存期

Rust 通过引入生存期 (lifetime) 的概念来确定一个引用的作用域:

struct Foo<'a, 'b> {
    x: &'a i32,
    y: &'b i32,
}

fn main() {
    let a = &5;
    let b = &8;
    let f = Foo { x: a, y: b };

    println!("{}", f.x + f.y);
}

因为结构体Foo有自己的生存期,所以我们需要给它所包含的域指定新的生存期'a'b, 从而确保对i32的引用比对Foo的引用具有更长的生存期,避免悬空指针 (dangling pointer) 的问题。

Rust预定义的'static具有和整个程序运行时相同的生存期,主要用于声明全局变量。 由const关键字定义的常量也具有'static生存期,但是它们会被内联到使用它们的地方。

const N: i32 = 5;

static NUM: i32 = 5;
static NAME: &'static str = "David";

其中类型标注是不可省略的,并且必须使用常量表达式初始化。 对于通过static mut绑定的变量,则只能在unsafe代码块里使用。

对于共享所有权,需要使用标准库中的Rc<T>类型:

use std::rc::Rc;

struct Car {
    name: String,
}

struct Wheel {
    size: i32,
    owner: Rc<Car>,
}

fn main() {
    let car = Car { name: "DeLorean".to_string() };

    let car_owner = Rc::new(car);

    for _ in 0..4 {
        Wheel { size: 360, owner: car_owner.clone() };
    }
}

如果是在并发中共享所有权,则需要使用线程安全的Arc<T>类型。

Rust支持生存期省略 (lifetime elision),它允许在特定情况下不写生存期标记, 此时会遵从三条规则:

  • 每个被省略生存期标记的函数参数具有各不相同的生存期。
  • 如果只有一个输入生存期 (input lifetime),那么不管它是否省略, 这个生存期都会赋给函数返回值中所有被省略的生存期。
  • 如果有多个输入生存期,并且其中有一个是&self或者&mut self, 那么self的生存期会赋给所有被省略的输出生存期 (output lifetime)。