Nice programing

Spark Dataframe의 처음 1000 개 행을 가져 오는 방법이 있습니까?

nicepro 2020. 12. 11. 19:26
반응형

Spark Dataframe의 처음 1000 개 행을 가져 오는 방법이 있습니까?


randomSplit함수를 사용하여 개발 목적으로 사용할 소량의 데이터 프레임을 얻고 있으며이 함수에서 반환하는 첫 번째 df 만 가져옵니다.

val df_subset = data.randomSplit(Array(0.00000001, 0.01), seed = 12345)(0)

내가 사용 df.take(1000)하면 데이터 프레임이 아닌 행 배열로 끝나므로 작동하지 않습니다.

df의 처음 1000 개 행을 다른 df로 저장하는 더 좋고 간단한 방법이 있습니까?


찾고있는 방법은 .limit 입니다.

처음 n 개 행을 가져 와서 새 데이터 세트를 반환합니다. 이 함수와 head의 차이점은 head는 배열을 반환하는 반면 limit는 새로운 Dataset을 반환한다는 것입니다.

참고 URL : https://stackoverflow.com/questions/34206508/is-there-a-way-to-take-the-first-1000-rows-of-a-spark-dataframe

반응형