R

R/데이터 전처리(1)

25G 2021. 9. 16. 21:50

 

데이터 전처리에 사용될 함수

전처리 하기 위해서 dplyr패키지를 사용할 것이다.

 

dplyr에서 제공되는 함수이다

로드 후 예제 데이터를 불러왔다.

 

fliter함수

filter는 내가 원하는 어떠한 조건에 특정한 데이터만 추출해 내는 함수이다.

%>%:는 파이프 연산자라고 하는데 함수들을 연결해 준다.

 

filter응용

매치 연산자

목록에 해당하는 것만 추출하고 싶을 때

% in%: 매치 연산자 

변수의 값이 지정한 조건 목록에 해당하는지 확인하는 기능

 

 

필요한 변수만 추출하기(열 추출)

여러 변수 추출

위 filter나 select를 사용하는 이유는 데이터가 엄청나게 많으면 컴퓨터가 연산하는데 오래 걸리기 때문에 필요한 데이터만 추출해서 분석하기 위함이다

 

변수 제외하기

select는 필요한 부분만 빼고 추출할 수도 있다.

파이프 연산자가 유용한 이유

위와 같이 함수를 연결하면 유용하게 사용할 수 있다.

 

 

 

정렬

 

 

R의 특징은 세세한 기능들이 다 함수로 이루어져 있다.

 

arrange함수

오름차순
내림차순

 

'R' 카테고리의 다른 글

R/데이터 정제  (0) 2021.09.23
R/데이터 전처리(2)  (0) 2021.09.23
R/데이터 프레임  (0) 2021.09.16
R 데이터의 구조  (0) 2021.09.14
R언어 기본 문법  (0) 2021.09.14