Spark Dataframe의 처음 1000 개 행을 가져 오는 방법이 있습니까?

Nice programing

nicepro 2020. 12. 11. 19:26

이 randomSplit함수를 사용하여 개발 목적으로 사용할 소량의 데이터 프레임을 얻고 있으며이 함수에서 반환하는 첫 번째 df 만 가져옵니다.

val df_subset = data.randomSplit(Array(0.00000001, 0.01), seed = 12345)(0)

내가 사용 df.take(1000)하면 데이터 프레임이 아닌 행 배열로 끝나므로 작동하지 않습니다.

df의 처음 1000 개 행을 다른 df로 저장하는 더 좋고 간단한 방법이 있습니까?

찾고있는 방법은 .limit 입니다.

처음 n 개 행을 가져 와서 새 데이터 세트를 반환합니다. 이 함수와 head의 차이점은 head는 배열을 반환하는 반면 limit는 새로운 Dataset을 반환한다는 것입니다.

와일드 카드가 일치하는 파일 찾기 (0)	2020.12.11
어떻게 든 Swift에서 NSURLSession을 통해 동기 HTTP 요청을 할 수 있습니까? (0)	2020.12.11
Jupyter 노트북의 변수 탐색기 (0)	2020.12.11
수은에서 작업 개정을 어떻게 찾을 수 있습니까? (0)	2020.12.11
리플렉션 클래스를 사용하여 개인 / 보호 정적 속성을 설정하는 방법이 있습니까? (0)	2020.12.11

nicepro