Tokenizers 설치/에러/해결

by 지각생 2022. 5. 24.

pip로 설치하면 다음과 같다

pip install tokenizers

하지만 설치가 안될 경우가 종종 있다.

[코드를 다운 받아서 설치하는 방법]

-anaconda에 설치하기 때문에 새로운 방법이 필요했다.

먼저 rust를 설치한다.

curl https://sh.rustup.rs -sSf | sh -s -- -y
export PATH="$HOME/.cargo/bin:$PATH"

다음에는 코드를 다운받아서 설치한다.

git clone https://github.com/huggingface/tokenizers
cd tokenizers/bindings/python

# Install `tokenizers` 
conda install -c conda-forge setuptools-rust
python setup.py install

conda를 사용하여 설치하기 때문에 pip install setuptools_rust 대신에 conda install -c conda-forge setuptools-rust를 사용한다.

이렇게 하면 될 것 같았는데 conda라서 그런지 conda env에 설치되지 않았다. 

따라서  ./bindings/python/build/lib.linux-x86_64-3.7/tokenizers의 파일을 conda의 가상환경 위치(~/anaconda3/envs/pl/lib/python3.7/site-packages/)로 cp -r 를 이용하여 옮겨놓았더니 해결



내가 쓴 해결법

curl https://sh.rustup.rs -sSf | sh -s -- -y
export PATH="$HOME/.cargo/bin:$PATH"

git clone https://github.com/huggingface/tokenizers
cd tokenizers/bindings/python

# Install `tokenizers` 
pip install setuptools_rust 
python setup.py install

나는 아나콘다 안쓰므로 위와 같이 했다

python setup.py install에서는 오류가 났지만 이후 


pip install tokenizers 를 하니 설치가 됐다.


아래는 설치 진행과정

