[Pandas] 예제코드로 보는 axis 옵션 톺아보기 - “axis =1 은 가로방향?! 아님 세로방향?! 한방에 정리해 봅시다🤓”

🚦 Summary

  • 판다스에서 쓰이는 axis 옵션은 데이터프레임에 대해 연산이 적용되는 방향에 대한 옵션입니다.
  • 하지만 실제로 코드가 작동할때는 연산이 적용되는 ‘대상’ 을 중점적으로 생각하는게 코드를 사용하는 것에 더 도움이 됩니다.
  • 처음 이 개념을 배우게 되면 연산의 방향과 대상을 혼동해 개념의 적용에 애를 먹거나, 일반적 상식으로 알고 있던 x축과 y축에 대한 개념으로 인해 사용법을 헷갈리기도 합니다.
  • 판다스에서 axis의 값이 0일때와 1일때 어떤 의미인지, 어떤 값을 기준으로 판단해야 하는지, 예제 코드 및 이미지 설명과 함께 살펴 봅니다.

8 분 소요

Personal_study, Pandas

[Cheat Sheet] “코드 한줄로 EDA를 하는 도구가 있다면?!”

🚦 Summary

  • 이번 포스팅에서는 데이터 분석 및 AI모델링의 가장 기본적 단계인 EDA를 손쉽게 하기 위한 도구를 소개합니다.
  • 샘플 데이터로는 seaborn의 대표적 예제데이터인 planets.csv 파일을 사용합니다.
  • 이 라이브러리를 사용하면 수십줄에 달하는 EDA 코드를 딱 1줄의 코드로 구현할 수 있습니다.
  • 전통적인 EDA 방법과의 비교를 위해 실제 데이터를 불러와서 EDA 하는 코드를 직접 작성했습니다.
  • 대용량의 파일에 대해서는 리포트 생성에 다소 많은 시간이 필요하지만, 간단하게 데이터를 살펴보고 분석 방향 및 데이터 전처리 방향을 설정하기에 유용한 도구라 생각합니다.

4 분 소요

Personal_study, Cheat_sheet, Cheat-sheet

[Cheat Sheet] [Pre-processing] 형변환을 활용한 효율적인 데이터 전처리팁 모음

🚦 Summary

  • Series 데이터 생성시 사용하는 옵션인 dtype를 활용한 효율적이면서 유용한 데이터 변환 방법과 사례들을 소개합니다.

4 분 소요

Personal_study, Cheat_sheet, Cheat-sheet

“[Review] [모두의연구소][모두팝] “오픈소스로 기여하고 취뽀하기” 세미나 내용 정리 및 리뷰😀

🚦Summary.

  • 이 세미나는 연사님이 직접 오픈소스 프로젝트에 참여하며 겪은 다양한 정보들과 오픈소스 프로젝트에 참여하기 위한 방법에 대한 지식을 공유하는 자리였습니다.
  • 연사님의 오픈소스 기여 팁과 취업에 대한 이야기, 오픈소스 로미오 개발 경험 공유에 대한 내용이 세미나의 주요 내용입니다.
  • 특히 아래의 내용을 주로 다룹니다.
    • 국내 기업의 오픈소스 활용 동향
    • 오픈소스 기여의 중요성 및 시작 방법, 그리고 프로젝트에서의 커뮤니티 활동과 기여 방법
    • 오픈소스 기여의 혜택과 한국의 오픈소스 활성화, 그리고 오픈소스 기여에 필요한 영어 실력 등 Q&A

6 분 소요

Gabe_ai_journey, Reviews

[파이썬 뜯어보기] 둘 다 그냥 and 조건 아니었어?! : “&” 와 “and” 연산자 뜯어보기

🚦Summary

  • “&” 과 “and”는 모두 표현식 이며, 비교연산에 사용될 수 는 있지만, 그 용도와 작동 방식이 다릅니다.
  • 같은 ‘and’라는 단어적 의미로 이해를 하고 구분 없이 사용하면 올바른 코드를 작성했음에도 불구하고 잘못된 결과를 도출하는 문제가 발생할 수 있습니다.
  • 그 원인은 바로 연산우선순위와, 비트연산이라는 차이에서 기인하며, 이로 인해 예상과는 다른 연산을 하게 됩니다.
  • 따라서 각각의 특성을 고려해 목적에 맞게 사용하는 것이 중요합니다.
  • 다만, 조건문(Conditional Statement) 에서는 반드시 ‘and’ 연산자를 사용해야 예상치 못한 연산오류 없이 원하는 결과를 얻을 수 있습니다.

8 분 소요

Personal_study, Python