
안녕하세요?
삼성SDS Brightics 서포터즈 김혜현입니다 😊
지난 포스팅의 Titanic 데이터 분석 잘 따라오셨겠죠 ~?
이번 포스팅에서는 데이터 시각화를 중심으로 진행할 예정입니다 🥰
🤍 지난 포스팅이 궁금하시다면 아래 링크를 참고해주세요 ㅎㅎ 🤍
[삼성SDS Brightics 서포터즈] Brightics Studio_Kaggle Titanic 데이터 전처리
안녕하세요? 삼성SDS Brightics 서포터즈 김혜현입니다 😊 지난 포스팅에서는 Brightics의 간단한 사용법에 대해 소개했는데 다들 기억 나시나요 ~? 앞으로 3번의 포스팅 동안 Kaggle의 Titanic 데이
khyeon.tistory.com
데이터 시각화하는 것을 보여주기 위해
제가 선정한 데이터는 바로바로
Kaggle의 Iris Species 데이터 입니다 😊
Iris데이터는 캐글의 여러 데이터 중 유독
데이터의 양뿐만 아니라 컬럼의 수까지
상대적으로 많이 적다는 것을 단번에 알아차릴 수 있을 것입니다 !
데이터 셋을 불러오는 방법은
앞서 지속적으로 설명하였기에 자세한 내용은 생략하도록 하겠습니다 :)
데이터를 살펴보면 총 5개의 컬럼에 150개의 row로 구성되어 있는걸 확인할 수 있습니다.
그동안 분석한 데이터와는 달리 상대적으로 많이 적다는게 느껴지시죠 ?!
💙 5개의 컬럼에는 무엇이 있을까요 ? 💙
1. Sepal Length(꽃받침 길이)
2. Sepal Width(꽃받침 너비)
3. Petal Length(꽃잎 길이)
4. Petal Width(꽃잎 너비)
5. Species(붓꽃 종류)
위의 데이터를 String Summary 함수와
Statistic Summary 함수를 사용하여 데이터 요약 통계량을 확인하였습니다.
그 결과
꽃잎의 종류는 총 5가지이며,
각각의 종류마다 50개의 데이터가 존재한다는 것을 알 수 있었습니다 !
또, 모든 컬럼에는 Null 값이 존재하지 않음을 확인하였습니다.
그동안 데이터를 전처리하면서
데이터를 시각화한 적이 있을 것입니다.
오늘은 거기서 나아가
한 화면에서 다양한 그래프를 확인하고,
데이터의 값을 조정하기 위한 기능에 대해 알아보도록 하겠습니다.
위의 그림을 참고해 주세요 😊
위의 그림은 Scatter plot(산점도)그래프 입니다.
그래프를 통해 setosa는 versicolor와 virginica와 구분되지만
versicolor와 virginica는 명확하게 구분되지 않는다는 것을 알 수 있었습니다.
Box plot(상자도표) 그래프는
데이터의 최댓값, 최솟값, 중앙값, 사분편차를 알 수 있는데요,
위의 그래프를 통해 Iris 데이터는
전처리할 특별한 이상치가 없다는 것을 확인할 수 있었습니다.
위의 그래프는 area그래프 입니다.
이 외에도 네모박스 안의 아이콘을 누르면
다양한 그래프들을 확인할 수 있습니다.
이 그래프들의 데이터를 조정하여 원하는 그래프를 만들어보고
이를 통해 인사이트를 얻어 데이터를 전처리하실 수 있답니다 😊
어때요 ?
내가 하고 싶은 것들을 어려운 코딩이 아닌
클릭과 사고로 만들어진다는게 너무 신기하지 않나요 ?!
💙 앞으로도 Brightics AI 많이 이용해 주세요 💙

그럼 다음 포스팅에서 만나요 🥰
* Brightics 서포터즈로서 직접 체험하고 작성한 리뷰입니다 *
#삼성SDS #BrighticsAI #BriticsStudio #macBrighticsStudio #Brightics #브라이틱스 #Brightics서포터즈 #서포터즈 #발대식 #모델링 #데이터분석 #데이터사이언티스트 #삼성서포터즈 #대외활동 #대외활동추천 #데이터분석대외활동 #대학생대외활동
'Brightics AI' 카테고리의 다른 글
[삼성SDS Brightics 서포터즈] Brightics 홍보영상 제작_슬기로운분석생활팀_분석맨(feat. 워크맨) (0) | 2021.07.13 |
---|---|
[삼성SDS Brightics 서포터즈] Brightics Studio_Iris Species 머신러닝 실습 (0) | 2021.06.28 |
[삼성SDS Brightics 서포터즈] 삼성SDS 온라인 무료 세미나 💙 (0) | 2021.06.24 |
[삼성SDS Brightics 서포터즈] Brightics Studio_Kaggle Titanic 머신러닝 실습 (0) | 2021.06.22 |
[삼성SDS Brightics 서포터즈] Brightics Studio_Kaggle Titanic 데이터 인코딩 (0) | 2021.06.22 |