• 엑셀이란?

엑셀은 xls또는 xlsx형식을 가진 파일을 말한다.

xls는 엑셀 2003이전에 저장된 파일을 말하고, xlsx는 2007이후 저장된 파일을 말한다.

이후 말하는 엑셀은 xlsx를 지칭한다.

 

 

  • xlsx에서 csv로 

R로 데이터 불러올 때, 엑셀 데이터를 불러오는 패키지가 발달하기 전에는 엑셀을 csv로 바꾸어, 우회적으로 csv 파일을 불러오기도 했다고 한다. 또, 엑셀 데이터를 불러오는 패키지가 나온 이후에도, 엑셀 데이터를 불러오는 속도보다, csv 데이터를 불러오는 속도가 눈에 띄게 빨랐다고도 한다. (직접 경험은 잘 없음)

 

xlsx파일을 csv로 바꾸면 어떻게 될까?

 

엑셀 화면

 

이러한 화면에서 다른이름으로 저장 - 확장자 이름을 csv형태로 하고 저장을 하면, 다음과 같은 경고가 나온다.

 

경고

 

재밌는 것은 '예' 버튼을 누른 이후에도, 화면은 변화가 없어 보인다.

그렇다면 대체 무엇이 바뀐 것일까? 

 

저장된 파일을 보자.

 

용량이 바뀐 것을 확인할 수 있다.

 

 

아이콘이 a, 라고 바뀌었다.

 

 

  • csv(링크 : 위키피디아)

 

comma seperated value의 약자로, 컴마로 데이터를 구분한 것이다. 그리고 사실 csv는 파일형식의 측면에서는 엑셀하고는 크게 관계가 있지는 않다. 화면으로만 같아보일 뿐이다.

 

csv파일을 메모장으로 열어보면 다음과 같다.

 

csv 메모장 실행결과

 

 

참고로 엑셀은 메모장으로 실행하면, 다음과 같이 정상적으로 열리지 않는다.

 

xlsx 메모장 실행결과

 

 

 

 

  • csv의 추가적인 활용

직접 경험해보지는 않았지만, 60GB가량의 엑셀 데이터를 csv로 바꾸면 1GB 정도로 줄어드는 경우가 있다고 한다. 이유인즉, 엑셀에서 사용하는 표나 여러 형식이 가지는 용량을 csv형태로 저장하면서 줄일 수 있어서다.  

이를 이용하여, 효율적으로 데이터를 활용할 수도 있다고 한다.

 

자세한 내용이 궁금하다면, 김종엽선생님의 유튜브 영상 "깜신의 통계 왕초보 탈출 2탄"을 참고하면 좋겠다.

 

 

 

'R > R 기초' 카테고리의 다른 글

팩터형 변수 수치형으로 바꾸기  (0) 2019.04.11
패키지와 라이브러리  (0) 2019.04.01

+ Recent posts