1. 원자벡터와 리스트
벡터의 유형은 크게 두가지가 있다.
원자 벡터와 리스트.
원자벡터는 (벡터의 유형이) 서로 같아야만 하고, 리스트는 서로 다르게 표현 될 수도 있다.
본문에서는 원자벡터는 동질적, 리스트는 이질적이라고 되어있다.
원자 벡터는 integer, double, character(복소수형), character(문자형), logical, raw 중에 하나의 유형만 가진다.
복소수형과 원시형은 데이터 분석에 거의 사용되지 않는다고 한다.
리스트는 다른 리스트를 포함할 수 있다는 의미에서, 재귀 벡터라고도 표현한다.
2. 벡터가 없는 상태
벡터가 없는 상태를 표현하는 방법은 NULL을 이용한다.
NULL은 길이가 0인 벡터처럼 작동한다고 한다.
3. 벡터의 유형과 길이
벡터의 주요 속성에는 2가지가 있다.
유형과 길이.
유형을 알아내는 함수는 typeof()이며, 길이를 알아내는 함수는 length()다.
4. 확장 벡터(argumented vector)
1> 확장벡터란?
속성을 이용하면, 추가 동작을 기반으로 하는 확장 벡터를 만들 수 있다.
속성을 이용하는 방법
추가 메타 데이터를 속성(attribute) 형식으로 벡터에 포함시킬 수 있다.
메타 데이터란, 데이터에 대한 데이터다.
도서관에 있는 책들을 데이터로 본다면, 그 책들의 이름이나 저자의 이름의 목록을 데이터로 만든 것이 메타 데이터라고 한다.
속성이란, 사물이 어떠한 것인가를 나타내고, 그것을 다른 것과 구별하는 성질을 말한다.
통계학에서 이야기하는 '변수'의 개념과 비슷한 것 같다.
DB(관계형 데이터베이스 - 데이터를 표형태로 나타내보려는 방법)에서는 조금 더 까다로운 규칙을 사용해서 약속하는 것 같다. (이론적인 내용밖에 잘 모른다.)
2> 확장 벡터의 유형
● 팩터형은 정수형 벡터를 기반으로 만들었다.
● 데이트형과 데이트-타임형은 수치형 벡터를 기반으로 만들었다.
● 데이터프레임과 티블은 리스트를 기반으로 만들어졌다.
'R > R 중급' 카테고리의 다른 글
코드 스타일 : 구글의 스타일 가이드 (0) | 2019.04.09 |
---|---|
tidyverse 이해를 돕는 그림 (0) | 2019.04.04 |