데이터 전처리에 사용될 함수
전처리 하기 위해서 dplyr패키지를 사용할 것이다.
dplyr에서 제공되는 함수이다
로드 후 예제 데이터를 불러왔다.
fliter함수
filter는 내가 원하는 어떠한 조건에 특정한 데이터만 추출해 내는 함수이다.
%>%:는 파이프 연산자라고 하는데 함수들을 연결해 준다.
매치 연산자
목록에 해당하는 것만 추출하고 싶을 때
% in%: 매치 연산자
변수의 값이 지정한 조건 목록에 해당하는지 확인하는 기능
필요한 변수만 추출하기(열 추출)
여러 변수 추출
위 filter나 select를 사용하는 이유는 데이터가 엄청나게 많으면 컴퓨터가 연산하는데 오래 걸리기 때문에 필요한 데이터만 추출해서 분석하기 위함이다
변수 제외하기
select는 필요한 부분만 빼고 추출할 수도 있다.
파이프 연산자가 유용한 이유
위와 같이 함수를 연결하면 유용하게 사용할 수 있다.
정렬
R의 특징은 세세한 기능들이 다 함수로 이루어져 있다.
arrange함수