Brightics AI

[삼성SDS Brightics 서포터즈] Brightics Studio_Kaggle Titanic 데이터 인코딩

김혠 2021. 6. 22. 20:53

안녕하세요?

삼성SDS Brightics 서포터즈 김혜현입니다 😊

지난 포스팅의 Titanic 데이터 전처리하기 잘 따라오셨겠죠 ~?

앞으로 3번의 포스팅 동안 Kaggle의 Titanic 데이터를 이용하여

데이터의 전처리부터 평가까지 진행할 예정입니다 😆

이번 포스팅에서는 데이터 인코딩하는 과정을 예정이니 차근차근 따라와주세요 🥰

🤍 지난 포스팅이 궁금하시다면 아래 링크를 참고해주세요 ㅎㅎ 🤍

https://khyeon.tistory.com/entry/%EC%82%BC%EC%84%B1SDS-Brightics-%EC%84%9C%ED%8F%AC%ED%84%B0%EC%A6%88-Brightics-StudioKaggle-Titanic-%EB%8D%B0%EC%9D%B4%ED%84%B0-%EC%A0%84%EC%B2%98%EB%A6%AC

 

[삼성SDS Brightics 서포터즈] Brightics Studio_Kaggle Titanic 데이터 전처리

안녕하세요? 삼성SDS Brightics 서포터즈 김혜현입니다 😊 ​ 지난 포스팅에서는 Brightics의 간단한 사용법에 대해 소개했는데 다들 기억 나시나요 ~? ​ 앞으로 3번의 포스팅 동안 Kaggle의 Titanic 데이

khyeon.tistory.com

 

이전 포스팅에서 진행한 전처리한 데이터를 인코딩 해야하는데요,

얼핏보면 불필요해보일수 있지만,,,😥

머신러닝 모델에 데이터를 넣기 위해서 꼭 거쳐야 하는 작업입니다 !!

 

데이터를 인코딩 하기에 앞서

앞으로 사용할 데이터를 선택해 주도록 하겠습니다.

Select Column 함수를 사용하여

Survived, Pclass, Sex, Age_R, Fare_R, Embarked, Alone 데이터를 선택하였습니다.

머신러닝에 데이터를 집어넣기 위해

숫자형 데이터를 제외한 나머지 데이터를 모두 인코딩 해주었습니다.

Label Encoder 함수를 사용하여

Sex, Embarked, Age_R, Alone, Fare_R 컬럼인코딩 해주었습니다.

인코딩할때마다 함수를 반복적으로 생성하시는 작업이 귀찮으시죠,,??

Brightics Studio는 복제 기능이 있답니다 !!

위 카드뉴스의 네모상자 안에있는 버튼을 눌러 드래그 하시면 복제가 가능합니다 😝

인코딩 별거 아니죠 ~?

이제 머신러닝 작업만 남았답니다 ㅜㅜ 🙊

어렵게만 다가웠던 데이터 분석,

💙Brightics와 함께해요 💙

혹시라도 궁금한 것이 있다면 댓글로 남겨주세요 >.ㅇ

그럼 다음 포스팅에서 만나요 🥰

* Brightics 서포터즈로서 직접 체험하고 작성한 리뷰입니다 *

#삼성SDS #BrighticsAI #BriticsStudio #macBrighticsStudio #Brightics #브라이틱스 #Brightics서포터즈 #서포터즈 #발대식 #모델링 #데이터분석 #데이터사이언티스트 #삼성서포터즈 #대외활동 #대외활동추천 #데이터분석대외활동 #대학생대외활동