반응형
Spark Dataframe의 처음 1000 개 행을 가져 오는 방법이 있습니까?
이 randomSplit
함수를 사용하여 개발 목적으로 사용할 소량의 데이터 프레임을 얻고 있으며이 함수에서 반환하는 첫 번째 df 만 가져옵니다.
val df_subset = data.randomSplit(Array(0.00000001, 0.01), seed = 12345)(0)
내가 사용 df.take(1000)
하면 데이터 프레임이 아닌 행 배열로 끝나므로 작동하지 않습니다.
df의 처음 1000 개 행을 다른 df로 저장하는 더 좋고 간단한 방법이 있습니까?
찾고있는 방법은 .limit 입니다.
처음 n 개 행을 가져 와서 새 데이터 세트를 반환합니다. 이 함수와 head의 차이점은 head는 배열을 반환하는 반면 limit는 새로운 Dataset을 반환한다는 것입니다.
반응형
'Nice programing' 카테고리의 다른 글
와일드 카드가 일치하는 파일 찾기 (0) | 2020.12.11 |
---|---|
어떻게 든 Swift에서 NSURLSession을 통해 동기 HTTP 요청을 할 수 있습니까? (0) | 2020.12.11 |
Jupyter 노트북의 변수 탐색기 (0) | 2020.12.11 |
수은에서 작업 개정을 어떻게 찾을 수 있습니까? (0) | 2020.12.11 |
리플렉션 클래스를 사용하여 개인 / 보호 정적 속성을 설정하는 방법이 있습니까? (0) | 2020.12.11 |