본문 바로가기
대학원 라이프/Step2.2 : 졸업논문작성기

논문 작업을 효율적으로 수행하기 위한 개발 도구: 구글 코랩 vs. VS Code 비교

by 더함 2023. 6. 5.
반응형

최근에 본격적으로 논문에 대해 말로만 주절주절하던 내용들을 코드로 구현...하려고 노력하고 있다.

해보며 느끼는 점은 정말 ChatGPT가 도입된 1세대 논문 졸업세대인데, 이게 없었으면 아마 1~2달정도 구글링으로 노가다를 반복하다가 포기할 가능성이 정말 높지 않았을까 싶다. 24시간 상주하는 코딩 선생님처럼 활용 중..

(그 덕에 이 기회에 유튜브 구독 끊고 ChatGPT 구독했는데.. 미국분들이 부가세를 받으시는데.. 이거 우리나라에 납부는 하는거겠지..? 세율이 우리나라 세율인데..)

 

진도는 모래알처럼 나가지만 아무튼 이전과는 달리 오늘 파이썬 영상보면서 오늘 연습하고 삭제하면 끝나는 작업이 아니라, 연속성이 있고, 원천 데이터가 필요한 작업을 지속적으로 하다보니 구글코랩과 VScode와 같은 IDE 개발환경의 장단점이 명확하게 느껴졌다. 몇 주만에 세팅을 다시 하는 중인데, 이런 점을 작성 전부터 참고하면 좋을 것 같아 작성해본다.

(사실 휴일에 카페와서 코딩 하다가 연이은 오류 발생에 머리가 지끈거려서 쉬는 중..)

1. 구글 코랩

 

어떤 파이썬 교재를 사도 첫 장에서 강추하는 구글 코랩.

 

일단 공유 드라이브 기반으로 작업하고 저장하므로 별도로 파일 관리를 하지 않아도 어디서든 작업을 이어서 할 수 있다.

또한 필수로 사용되는 많은 library들이 이미 설치되어 있어서 import하는 것만으로 사용할 수 있다.

 

심지어 자연어 처리를 하는 경우 많이 사용하는 Mecab.. 윈도우를 사용하면 이놈을 사용하기 위해 온갖 난리를 치다가 되기도 하고 실패하기도 하고 아무튼 말썽이 많은데, 코랩에서는 검색해서 몇몇 Github을 참조하면 그리 어렵지 않게 Mecab도 사용이 가능하다!

 

그렇게 무조건적인 장점만 있었는데..

 

아래는 위키피디아 한국어 말뭉치 파일을 통해 sentences 리스트에 문장들을 전처리해서 추가해주는 작업이다.

VScode로 작성한 내용인데, 소요시간을 보면 무려 8분이 걸렸다.

그말인 즉슨, 코랩으로 작업하면 항상 최상단부터 코드를 다시 실행시켜줘야 하기 때문에 8분짜리 이 코드 한줄을 매번 돌려줘야 한다는 뜻이 된다.

 

게다가 저 위에 processed_wiki.ko.txt 파일은 txt 파일인 주제에 무려 1기가에 달하는 고용량의 파일이다.

코드에서 참조하는 파일들을 항상 임시 저장공간을 할당하여 일정 시간 사용할 수 있게 해주고, 시간이 지나면 모두 삭제되는 특성상, 항상 1기가 짜리 파일을 코랩에 다시 업로드 해줘야 하는 수고로움이 발생한다.

(심지어 고용량이라 그런가 이상하게 업로드 자체가 잘 안됨)

 

그리고 좀 부가적인 내용이지만 코랩의 경우 공유 드라이브인 관계로 우리 회사의 경우 보안정책으로 인해 접속 자체가 되질 않는다..ㅠㅠ

 

2. VS code

 

VS code 혹은 Jupyter Notebook으로 대표되는 IDE 개발환경의 경우는 작업의 연속성이 장점이라고 할 수 있을 것 같다.

앞에 돌렸던 코드를 굳이 다시 돌리지 않아도 그대로 작업이 이어진다.

 

그리고 코랩과 반대로 파일은 어차피 하드건 외장이건 드라이브에 저장되어 있을 것이므로 별도의 업로드, 다운로드 과정도 필요가 없다.

 

다만 노트북 성능 자체가 많이 떨어지는 경우라면 무료로 사용하는 코랩보다도 성능이 떨어질 가능성이 있으며,

Anaconda의 경우는 덜하겠지만, VS code같은 경우 library들의 버전 충돌로 인해 실행이 안되는 경우들이 꽤나 잦다.

 

이상의 장, 단점들을 판단하여 본인의 사용 용도에 맞는 개발도구를 사용한다면 좀 더 편리한 코딩시간이 될 수 있지 않을까 싶다.

반응형

댓글