제네릭 데이터 타입

제네릭을 사용하면 함수 시그니처나 구조체와 같은 항목에 대한 정의를 만들 수 있다. 이렇게 정의한 제네릭은 다양한 구체적인 데이터 타입과 함께 사용할 수 있다. 먼저 제네릭을 사용해 함수, 구조체, 열거형, 메서드를 정의하는 방법을 살펴보자. 그런 다음 제네릭이 코드 성능에 미치는 영향에 대해 논의한다.

함수 정의에서의 제네릭 사용

제네릭을 사용하는 함수를 정의할 때, 일반적으로 매개변수와 반환 값의 데이터 타입을 지정하는 위치에 제네릭을 넣는다. 이렇게 하면 코드가 더 유연해지고, 함수를 호출하는 측에 더 많은 기능을 제공할 수 있으며, 코드 중복을 방지할 수 있다.

앞서 살펴본 largest 함수를 계속해서 예로 들면, 리스트 10-4는 슬라이스에서 가장 큰 값을 찾는 두 함수를 보여준다. 이 두 함수를 하나로 합쳐 제네릭을 사용하는 단일 함수로 만들어 볼 것이다.

Filename: src/main.rs


fn largest_i32(list: &[i32]) -> &i32 {
    let mut largest = &list[0];

    for item in list {
        if item > largest {
            largest = item;
        }
    }

    largest
}

fn largest_char(list: &[char]) -> &char {
    let mut largest = &list[0];

    for item in list {
        if item > largest {
            largest = item;
        }
    }

    largest
}

fn main() {
    let number_list = vec![34, 50, 25, 100, 65];

    let result = largest_i32(&number_list);
    println!("The largest number is {result}");
    assert_eq!(*result, 100);

    let char_list = vec!['y', 'm', 'a', 'q'];

    let result = largest_char(&char_list);
    println!("The largest char is {result}");
    assert_eq!(*result, 'y');
}

Listing 10-4: 함수명과 시그니처의 타입만 다른 두 함수

largest_i32 함수는 리스트 10-3에서 추출한 것으로, 슬라이스에서 가장 큰 i32 값을 찾는다. largest_char 함수는 슬라이스에서 가장 큰 char 값을 찾는다. 두 함수의 본문은 동일한 코드를 가지고 있으므로, 제네릭 타입 매개변수를 도입해 중복을 제거할 수 있다.

새로운 단일 함수에서 타입을 매개변수화하려면, 함수의 값 매개변수와 마찬가지로 타입 매개변수의 이름을 지정해야 한다. 타입 매개변수 이름으로는 어떤 식별자든 사용할 수 있지만, 관례적으로 Rust에서는 타입 매개변수 이름을 짧게, 보통 한 글자로 짓고 CamelCase를 사용한다. _type_의 약자인 T는 대부분의 Rust 프로그래머가 기본적으로 선택하는 이름이다.

함수 본문에서 매개변수를 사용할 때, 컴파일러가 그 이름의 의미를 알 수 있도록 시그니처에서 매개변수 이름을 선언해야 한다. 마찬가지로, 함수 시그니처에서 타입 매개변수 이름을 사용할 때는 사용하기 전에 타입 매개변수 이름을 선언해야 한다. 제네릭 largest 함수를 정의하기 위해, 함수 이름과 매개변수 목록 사이에 꺾쇠 괄호 <> 안에 타입 이름 선언을 넣는다. 다음과 같이:


fn largest<T>(list: &[T]) -> &T {

이 정의를 읽으면: 함수 largest는 어떤 타입 T에 대해 제네릭이다. 이 함수는 list라는 하나의 매개변수를 가지며, 이 매개변수는 T 타입 값의 슬라이스이다. largest 함수는 동일한 타입 T의 값에 대한 참조를 반환한다.

리스트 10-5는 시그니처에서 제네릭 데이터 타입을 사용한 largest 함수 정의를 보여준다. 이 리스트는 또한 i32 값의 슬라이스나 char 값의 슬라이스로 함수를 호출하는 방법도 보여준다. 이 코드는 아직 컴파일되지 않는다는 점에 유의하라.

This code does not compile! — Listing 10-5: 제네릭 타입 매개변수를 사용한 `largest` 함수; 아직 컴파일되지 않음

이 코드를 지금 바로 컴파일하면 다음과 같은 오류가 발생한다:


$ cargo run
   Compiling chapter10 v0.1.0 (file:///projects/chapter10)
error[E0369]: binary operation `>` cannot be applied to type `&T`
 --> src/main.rs:5:17
  |
5 |         if item > largest {
  |            ---- ^ ------- &T
  |            |
  |            &T
  |
help: consider restricting type parameter `T` with trait `PartialOrd`
  |
1 | fn largest<T: std::cmp::PartialOrd>(list: &[T]) -> &T {
  |             ++++++++++++++++++++++

For more information about this error, try `rustc --explain E0369`.
error: could not compile `chapter10` (bin "chapter10") due to 1 previous error

도움말 텍스트는 std::cmp::PartialOrd를 언급하는데, 이는 _트레이트(trait)_이며, 다음 섹션에서 트레이트에 대해 설명할 것이다. 지금은 이 오류가 largest 함수의 본문이 T가 될 수 있는 모든 가능한 타입에 대해 작동하지 않는다는 것을 알려준다는 점만 기억하라. 본문에서 타입 T의 값을 비교하려면, 값이 순서를 가질 수 있는 타입만 사용할 수 있다. 비교를 가능하게 하기 위해, 표준 라이브러리는 std::cmp::PartialOrd 트레이트를 제공하며, 이 트레이트를 타입에 구현할 수 있다(이 트레이트에 대한 자세한 내용은 부록 C를 참조하라). 위의 예제 코드를 수정하려면, 도움말 텍스트의 제안을 따라 T에 유효한 타입을 PartialOrd를 구현하는 타입으로 제한해야 한다. 그러면 예제가 컴파일될 것이다. 왜냐하면 표준 라이브러리는 i32와 char 모두에 대해 PartialOrd를 구현하기 때문이다.

구조체 정의에서의 사용

구조체 정의에서도 <> 구문을 사용해 하나 이상의 필드에 제네릭 타입 파라미터를 적용할 수 있다. Listing 10-6은 Point<T> 구조체를 정의하여 어떤 타입이든 x와 y 좌표 값을 담을 수 있게 한다.

Filename: src/main.rs


struct Point<T> {
    x: T,
    y: T,
}

fn main() {
    let integer = Point { x: 5, y: 10 };
    let float = Point { x: 1.0, y: 4.0 };
}

Listing 10-6: 타입 T의 x와 y 값을 담는 Point<T> 구조체

구조체 정의에서 제네릭을 사용하는 구문은 함수 정의에서 사용하는 것과 유사하다. 먼저 구조체 이름 바로 뒤에 꺾쇠괄호 안에 타입 파라미터의 이름을 선언한다. 그런 다음, 구조체 정의에서 구체적인 데이터 타입을 지정하는 대신 제네릭 타입을 사용한다.

Point<T>를 정의할 때 단 하나의 제네릭 타입만 사용했기 때문에, 이 정의는 Point<T> 구조체가 어떤 타입 T에 대해 제네릭이며, x와 y 필드가 모두 동일한 타입이라는 것을 의미한다. 만약 Listing 10-7과 같이 서로 다른 타입의 값을 가진 Point<T> 인스턴스를 생성하면 코드가 컴파일되지 않는다.

이 예제에서 x에 정수 값 5를 할당하면, 컴파일러는 이 Point<T> 인스턴스에서 제네릭 타입 T가 정수임을 알게 된다. 그런 다음 y에 4.0을 지정하면, x와 동일한 타입으로 정의된 y에 타입 불일치 오류가 발생한다:


$ cargo run
   Compiling chapter10 v0.1.0 (file:///projects/chapter10)
error[E0308]: mismatched types
 --> src/main.rs:7:38
  |
7 |     let wont_work = Point { x: 5, y: 4.0 };
  |                                      ^^^ expected integer, found floating-point number

For more information about this error, try `rustc --explain E0308`.
error: could not compile `chapter10` (bin "chapter10") due to 1 previous error

x와 y가 모두 제네릭이지만 서로 다른 타입을 가질 수 있는 Point 구조체를 정의하려면, 여러 개의 제네릭 타입 파라미터를 사용할 수 있다. 예를 들어, Listing 10-8에서는 Point의 정의를 변경하여 x가 타입 T이고 y가 타입 U인 Point<T, U>로 만든다.

Filename: src/main.rs


struct Point<T, U> {
    x: T,
    y: U,
}

fn main() {
    let both_integer = Point { x: 5, y: 10 };
    let both_float = Point { x: 1.0, y: 4.0 };
    let integer_and_float = Point { x: 5, y: 4.0 };
}

Listing 10-8: x와 y가 서로 다른 타입의 값을 가질 수 있도록 두 타입에 대해 제네릭인 Point<T, U>

이제 표시된 모든 Point 인스턴스가 허용된다! 정의에서 원하는 만큼 제네릭 타입 파라미터를 사용할 수 있지만, 몇 개 이상 사용하면 코드를 읽기 어려워진다. 만약 코드에서 많은 제네릭 타입이 필요하다면, 코드를 더 작은 단위로 재구성해야 할 수도 있다는 신호일 수 있다.

열거형 정의에서의 제네릭 사용

구조체와 마찬가지로, 열거형도 제네릭 데이터 타입을 포함하도록 정의할 수 있다. 표준 라이브러리에서 제공하는 Option<T> 열거형을 다시 살펴보자. 이 열거형은 6장에서 사용한 바 있다:


#![allow(unused)]
fn main() {
enum Option<T> {
    Some(T),
    None,
}
}

이제 이 정의가 더 명확하게 이해될 것이다. Option<T> 열거형은 타입 T에 대해 제네릭으로 정의되며, 두 가지 변형을 가지고 있다: Some은 타입 T의 값을 하나 포함하고, None은 아무 값도 포함하지 않는다. Option<T> 열거형을 사용하면 선택적 값이라는 추상적인 개념을 표현할 수 있다. 그리고 Option<T>가 제네릭이기 때문에, 선택적 값의 타입이 무엇이든 이 추상화를 사용할 수 있다.

열거형은 여러 개의 제네릭 타입을 사용할 수도 있다. 9장에서 사용한 Result 열거형의 정의가 그 예시다:


#![allow(unused)]
fn main() {
enum Result<T, E> {
    Ok(T),
    Err(E),
}
}

Result 열거형은 두 가지 타입 T와 E에 대해 제네릭으로 정의되며, 두 가지 변형을 가지고 있다: Ok는 타입 T의 값을 포함하고, Err는 타입 E의 값을 포함한다. 이 정의 덕분에 어떤 작업이 성공적으로 완료되어 타입 T의 값을 반환하거나, 실패하여 타입 E의 오류를 반환할 수 있는 상황에서 Result 열거형을 편리하게 사용할 수 있다. 실제로 이 열거형은 9장의 예제 9-3에서 파일을 열 때 사용되었다. 파일이 성공적으로 열리면 T는 std::fs::File 타입으로 채워지고, 파일을 여는 데 문제가 발생하면 E는 std::io::Error 타입으로 채워졌다.

코드에서 여러 구조체나 열거형 정의가 포함하는 값의 타입만 다르고 나머지는 동일한 상황을 발견한다면, 제네릭 타입을 사용해 중복을 피할 수 있다.

메서드 정의에서의 제네릭

구조체와 열거형에 메서드를 구현할 때(5장에서 다룬 것처럼) 제네릭 타입을 사용할 수도 있다. 리스팅 10-9는 리스팅 10-6에서 정의한 Point<T> 구조체에 x라는 메서드를 구현한 예제를 보여준다.

Filename: src/main.rs


struct Point<T> {
    x: T,
    y: T,
}

impl<T> Point<T> {
    fn x(&self) -> &T {
        &self.x
    }
}

fn main() {
    let p = Point { x: 5, y: 10 };

    println!("p.x = {}", p.x());
}

Listing 10-9: Point<T> 구조체에 x 필드의 참조를 반환하는 x 메서드 구현

여기서는 Point<T>에 x라는 메서드를 정의했으며, 이 메서드는 x 필드에 있는 데이터의 참조를 반환한다.

impl 바로 뒤에 T를 선언해야 Point<T> 타입에 메서드를 구현할 수 있다. impl 뒤에 T를 제네릭 타입으로 선언하면 Rust는 Point의 꺾쇠 괄호 안에 있는 타입이 구체적인 타입이 아닌 제네릭 타입임을 인식한다. 구조체 정의에서 선언한 제네릭 매개변수와 다른 이름을 사용할 수도 있지만, 일반적으로 같은 이름을 사용한다. impl 블록 내에서 제네릭 타입을 선언한 메서드를 작성하면, 해당 메서드는 어떤 구체적인 타입이 제네릭 타입을 대체하든 상관없이 모든 타입 인스턴스에 정의된다.

메서드를 정의할 때 제네릭 타입에 제약을 걸 수도 있다. 예를 들어, 모든 제네릭 타입 T를 가진 Point<T> 인스턴스가 아닌, Point<f32> 인스턴스에만 메서드를 구현할 수 있다. 리스팅 10-10에서는 구체적인 타입 f32를 사용했기 때문에 impl 뒤에 타입을 선언하지 않았다.

Filename: src/main.rs


struct Point<T> {
    x: T,
    y: T,
}

impl<T> Point<T> {
    fn x(&self) -> &T {
        &self.x
    }
}

impl Point<f32> {
    fn distance_from_origin(&self) -> f32 {
        (self.x.powi(2) + self.y.powi(2)).sqrt()
    }
}

fn main() {
    let p = Point { x: 5, y: 10 };

    println!("p.x = {}", p.x());
}

Listing 10-10: 제네릭 타입 매개변수 T에 특정 구체적인 타입을 가진 구조체에만 적용되는 impl 블록

이 코드는 Point<f32> 타입이 distance_from_origin 메서드를 가지도록 한다. T가 f32 타입이 아닌 다른 Point<T> 인스턴스에는 이 메서드가 정의되지 않는다. 이 메서드는 점이 좌표 (0.0, 0.0)에서 얼마나 떨어져 있는지 측정하며, 부동소수점 타입에서만 사용 가능한 수학 연산을 활용한다.

구조체 정의에서 사용한 제네릭 타입 매개변수와 메서드 시그니처에서 사용한 제네릭 타입 매개변수가 항상 같을 필요는 없다. 리스팅 10-11에서는 Point 구조체에는 X1과 Y1이라는 제네릭 타입을 사용하고, mixup 메서드 시그니처에는 X2와 Y2라는 제네릭 타입을 사용해 예제를 더 명확하게 만들었다. 이 메서드는 self Point(타입 X1)의 x 값과 전달된 Point(타입 Y2)의 y 값을 사용해 새로운 Point 인스턴스를 생성한다.

Filename: src/main.rs


struct Point<X1, Y1> {
    x: X1,
    y: Y1,
}

impl<X1, Y1> Point<X1, Y1> {
    fn mixup<X2, Y2>(self, other: Point<X2, Y2>) -> Point<X1, Y2> {
        Point {
            x: self.x,
            y: other.y,
        }
    }
}

fn main() {
    let p1 = Point { x: 5, y: 10.4 };
    let p2 = Point { x: "Hello", y: 'c' };

    let p3 = p1.mixup(p2);

    println!("p3.x = {}, p3.y = {}", p3.x, p3.y);
}

Listing 10-11: 구조체 정의와 다른 제네릭 타입을 사용하는 메서드

main 함수에서는 x에 i32 타입의 값 5를, y에 f64 타입의 값 10.4를 가진 Point를 정의했다. p2 변수는 x에 문자열 슬라이스 "Hello"를, y에 char 타입의 값 c를 가진 Point 구조체다. p1에 p2를 인수로 전달해 mixup을 호출하면 p3가 생성된다. p3는 x가 p1에서 왔기 때문에 i32 타입의 값을 가지고, y가 p2에서 왔기 때문에 char 타입의 값을 가진다. println! 매크로 호출은 p3.x = 5, p3.y = c를 출력한다.

이 예제의 목적은 impl로 선언한 제네릭 매개변수와 메서드 정의로 선언한 제네릭 매개변수가 함께 사용되는 상황을 보여주기 위함이다. 여기서 X1과 Y1은 구조체 정의와 관련이 있기 때문에 impl 뒤에 선언되었다. 반면 X2와 Y2는 메서드와만 관련이 있기 때문에 fn mixup 뒤에 선언되었다.

제네릭을 사용한 코드의 성능

제네릭 타입 매개변수를 사용할 때 런타임 비용이 발생하는지 궁금할 수 있다. 다행히도 제네릭 타입을 사용해도 프로그램이 구체적인 타입을 사용할 때보다 느려지지 않는다.

Rust는 컴파일 타임에 제네릭 코드를 단일화(monomorphization)하는 방식으로 이를 달성한다. 단일화는 컴파일 시 사용된 구체적인 타입을 채워 제네릭 코드를 특정 코드로 변환하는 과정이다. 이 과정에서 컴파일러는 Listing 10-5에서 제네릭 함수를 만들 때 사용한 단계와 반대 작업을 수행한다. 컴파일러는 제네릭 코드가 호출된 모든 위치를 확인하고, 제네릭 코드가 호출된 구체적인 타입에 대한 코드를 생성한다.

표준 라이브러리의 제네릭 Option<T> 열거형을 예로 들어 이 과정이 어떻게 동작하는지 살펴보자:


#![allow(unused)]
fn main() {
let integer = Some(5);
let float = Some(5.0);
}

Rust가 이 코드를 컴파일할 때 단일화를 수행한다. 이 과정에서 컴파일러는 Option<T> 인스턴스에서 사용된 값을 읽고 두 가지 타입의 Option<T>를 식별한다: 하나는 i32이고 다른 하나는 f64이다. 따라서 컴파일러는 Option<T>의 제네릭 정의를 i32와 f64에 특화된 두 가지 정의로 확장하여 제네릭 정의를 구체적인 정의로 대체한다.

단일화된 코드는 다음과 같이 보인다(컴파일러는 설명을 위해 여기서 사용한 것과 다른 이름을 사용한다):

Filename: src/main.rs


enum Option_i32 {
    Some(i32),
    None,
}

enum Option_f64 {
    Some(f64),
    None,
}

fn main() {
    let integer = Option_i32::Some(5);
    let float = Option_f64::Some(5.0);
}

제네릭 Option<T>는 컴파일러가 생성한 구체적인 정의로 대체된다. Rust는 제네릭 코드를 각 인스턴스에서 타입을 명시한 코드로 컴파일하기 때문에 제네릭을 사용해도 런타임 비용이 발생하지 않는다. 코드가 실행될 때는 마치 각 정의를 수동으로 복제한 것과 동일한 성능을 보인다. 단일화 과정 덕분에 Rust의 제네릭은 런타임에서 매우 효율적으로 동작한다.