📊 R에서 데이터 프레임(Data Frame) 구조와 활용법

R 문법

초급 난이도
문법 타입
10/26 등록일

R에서 데이터 프레임(Data Frame) 구조와 활용법

초급
태그
기초 문법 데이터프레임 결측치 자료구조
## 개요
데이터프레임은 R에서 테이블 형태의 데이터를 저장하고 조작하는 주요 자료구조입니다. 행과 열로 구성된 2차원 배열로, 통계 분석 및 시각화에 필수적인 데이터 처리 기초 역할을 합니다.

## 주요 특징
- 벡터형 데이터를 여러열로 결합한 구조
- 행은 관측치, 열은 변수로 구성됨
- 문자열, 숫자, 논리형 등 다양한 자료형 혼합 가능
- NA(Not Available)로 결측값 처리 지원

## 사용법
```r
# 데이터프레임 생성
data_df <- data.frame(
Name = c('Alice', 'Bob', 'Charlie'),
Age = c(25, 30, 35),
Salary = c(50000, 60000, 70000)
)

# 열 접근
data_df$Age

# 행 필터링
subset(data_df, Age > 30)

# 결측치 처리
na.omit(data_df)
```

## 주의사항
- 데이터프레임은 리스트 형태로 저장되므로 `[[ ]]`로 요소 접근 시 유의
- 숫자형 열에 문자열을 입력하면 자동으로 factor 형으로 변환됨 (예: `data.frame(x = c(1, 'a'))`
- 결측치 처리는 데이터 정제 단계에서 반드시 확인해야 함

## 관련 문법
- 리스트(list): 데이터프레임의 내부 구조로 구성됨
- 타이블(tibble): tidyverse 패키지에서 제공하는 데이터프레임 대체형
- 데이터 마스터(matrices): 2차원 배열 형태의 자료구조
코드 예제
# 데이터프레임 생성 및 변환
data_df <- data.frame(
  Name = c('Alice', 'Bob', 'Charlie'),
  Age = c(25, 30, 35),
  Salary = c(50000, 60000, 70000)
)

# 데이터프레임을 tibble로 변환
library(tidyverse)
tbl_df <- as_tibble(data_df)

# 결측치 생성 및 처리
data_df_with_na <- data.frame(
  Name = c('Alice', 'Bob', 'Charlie'),
  Age = c(25, NA, 35)
)
na.omit(data_df_with_na)
등록일: 2025년 10월 26일 02:33
언어 정보
언어
R
카테고리
Data
인기도
#13
학습 팁
코드를 직접 실행해보세요
변수를 바꿔가며 실험해보세요
오류가 나도 포기하지 마세요
다른 예제도 찾아보세요