분류 전체보기
[결측치 탐색 및 처리] 다음은 결측치 관련 처리 작업을 학습할 것이다. 결측치를 처리해주는 방법은 여러가지가 있다. 대체, 삭제 등이 있는데 위에서 언급했듯 삭제는 신중해야 한다. 데이터 하나하나가 중요하기 때문이다. 사진 삭제 사진 설명을 입력하세요. 결측치 유무를 검색하는 코드는 isnull()이다. isnull은 기본적으로 True/False를 반환하기 때문에 (null값이면 True, 아니면 False) isnull을 합친 결과를 출력하는 의미로 위와 같이 짜준다 발생장소_구에 null값이 있음을 확인했으므로 해당 컬럼에 대한 처리가 필요함을 알 수 있다. 발생장소_구를 불러와보면 대표사진 삭제 사진 설명을 입력하세요. NaN으로 표기된 null값임을 확인할 수 있다. 우린 여기서 세종특별자치시..
이번 포스팅에서는 파이썬에서 가장 많이 활용하는 것을 작성하려 한다. 바로 pandas라이브러리인데, 말 그대로 도서관처럼, 편리하고 유용한 함수 모음집이라고 할 수 있다. 공공데이터포털에서 소방 관련 csv 데이터를 가져와 pandas를 활용해 데이터 분석을 해볼 예정이다. 가장 먼저 이번 포스팅부터 마지막 포스팅까지 활용할 라이브러리를 설치하고 import해줄 것이다. 물론 지금은 pandas만 사용할 것이기 때문에 pip~로 pandas만 설치해 주고 import해줄 것이다. (위 사진에서 import된 pandas말고 나머지는 무시해주길 바란다) 그리고 다운받은 소방 관련 데이터 파일을 불러와준다. 위처럼 csv파일을 읽어준다는 코드를 짜주고 뒤에 경로를 붙인다. 하지만, 오류가 반환됐다. utf..
저번 포스팅까지는 파이썬의 기본에 해당하는 함수와 코딩을 학습했다면 이번 포스팅에서는 for, while 반복문을 작성해볼 예정이다. 전에 학습하면서 for,while 초반까지는 괜찮았는데 코드가 길어지고 복잡해지면서 어려워했던 기억이 있다. 그렇게 안되길 바라면서... 이번에도 초장에 확실이 잡고 넘어갈 예정이다. [for, while 반복문] 전 포스팅에서 위와 같이 일일이 나누는 작업을 했다. 작업이 필요한 인수가 적을 땐 괜찮지만 인수가 많아질수록 효율적이지 못한 코드가 된다. for, while반복문은 이럴 때 사용하는 코드다. 위와 같이 분리한 문자열을 넣어줄 리스트를 만들어주고 i라는 변수를 새로 만들어준다. range(0,3)은 i라는 변수에 들어갈 숫자고 앞으로 작성할 코드의 i에 0,1..
앞선 포스팅에서는 숫자 데이터 관련한 메서드를 공부했다면 이번 포스팅에서는 문자열 데이터 관련 메서드를 작성할 예정이다. [Split, Strip, Append] 우선 문자열 분리에 대한 설명이다. 문자열 분리는 split함수가 있다. 구분자 ex) , , ' , ; , : 등을 기준으로 분리하는 방법이다 위 결과를 보면 알겠지만 split함수는 분리에 유용하지만 ,를 기준으로 분리하기 때문에 공백을 제거한 채로 결과값을 출력해주진 않는다. 이를 해결해 주기 위해 strip함수를 활용해 공백을 제거해줄 수 있다. strip함수는 문자열 양 끝의 공백을 제거한 채로 출력해주는 함수다. 양끝의 공백을 제거하는 데 유용하지만 역시 리스트 안의 공백을 제거하기엔 부족하다. 그러므로 이럴 땐 인덱스로 각각의 인수..
파이썬을 대학교에서도 잠깐 배웠지만 파이썬이라는 언어를 구동시키는(?) 방법에는 여러가지가 있다. 그리고 사람마다 어떤 프로그램을 쓰느냐는 다르다. 각각 장단점이 있긴한데 자세한건 모르겠다.... 일단 나는 pycharm, visual studio, google colab, 정도 써봤던 것 같다. 이번에 들을 강의에서는 visual studio를 쓴다. 아나콘다는 파이썬 자체를 포함하고 있어서 비쥬얼스튜디오에서 파이썬을 따로 설치할 필요가 없다. 근데 설치 과정과 파이썬 파일을 불러오고 저장하는 과정에서 애를 좀 먹었다... 혹시라도 비슷한 오류를 겪은 사람에게 도움이 됐으면 좋겠다.(아래 글 참고) 나는 c드라이브 - 유저에 저장해놨는데 내 폴더에 특수문자 ( ' ) 가 있어서 불러오지 못했다. (이거..
저번 포스팅의 주제도 파이썬을 활용한 포트폴리오를 만들어보기였다. 앞으로 진행할 내용도 비슷하게 파이썬을 활용한 포트폴리오 만들기이다. 강의를 고르면서 참고한 부분은(고민했던) raw데이터를 끌고 오는 방법이 상세했으면 좋겠다. 데이터 세트를 고르는 방법 데이터 분석 의도 및 목적이 확실한 강의인가 초보자(비전공자)들도 충분히 따라올 수 있고 실무에서 많이 쓰이는 함수를 사용하는가 이다. 1번 같은 경우, 전 강의에선 강의자께서 미리 준비하신 데이터 세트를 이용했고 강의를 다 수강한 후 내가 캐글에서 데이터를 끌고와서 해보려니 조금 어려움이 있었다. 그래서 데이터를 불러오는 상세한 과정이 담긴 강의였음 했고 2번과 3번은 살짝 비슷한 맥락인데, 목적에 따라 실습해볼 데이터 세트의 종류가 다..
너무 오랜만에 들어와보는 티스토리ㅋㅋ 너무 오랜만이라 좀 어색할 정도 ^_^;; 네이버 블로그도 안쓴지 오래됐는데 너무 압박갖지 않는 선에서 가끔가끔 써야지ㅇㅇ 티스토리도 간간히 쓸예정이다. 구글애널리틱스 실습용으로ㅇㅇ 그리고 네이버블로그랑 같은 내용의 글이 올라갈듯?? 복붙해서 쓸 것 같네. 잠~깐 해보니까 블로그 글쓰는것도 엄청 신경많이 써야해서 시간이 많이 걸리더라구요..ㅎㅎ 취미로 하고 기록용으로 하는거니까 너무 스트레스 받지 말아야겠다. 그럼 다음 포스팅까지 바이바이
약 4일전 격리 마지막날 이었다. 마지막날 치곤 몸 컨디션이 영~...... 격리해제 후에도 집에서 마스크 쓰고 있어야할듯..? 기침, 가래 아직 좀 있고 무엇보다 미각과 후각이 돌아오지 않았다. 후자는 전염성이 없다지만 기침, 가래는 아직 좀 위험하니까 쓰고 있어야겠다. 그래도 기부니가 좋았다. 그냥 격리 해제 마지막날이라 그런가...? 9월 5일 아침 늦게 일어나서 사과 하나 먹고 아침을 스킵했다. 아침 먹기 애매 한 시간이라 그냥 사과 하나 먹고 약을 챙겨먹었다. (사과만 먹고 약먹어도 되려나...?) 암튼 마지막 날이라 걍 기분이 좋다ㅎ 6일에 학교를 가야하는데 잔기침이 계속 나와서 교수님께 메일을 보냈다. 격리 해제 했는데도 계속 증상이 있어서 다른 학우들에게 피해가 갈 것 같다. 출석 ..
격리 6일차... 이제 증상은 거의 없어졌다. 목 아픈것도 많이 나아졌고 코로 숨 쉴 때 뭐랄까,,,, 그 목이 순식간에 말라서 아픈? 그런 느낌도 거의 없다. (그냥 평소랑 비슷한듯?) 그리고 가끔가다 가래 나오고 기침하는 정도? 그래도 다른 사람들 보다는 무사히 지나간 것 같다. 진짜 엄청 아프다고 하는 사람들도 많던데. 정말 다행이다. 9월 4일 아침 밥 먹기 전, 후 사진 찍는다는걸 계속 까먹음ㅠㅠㅠ 밥 먹다가 '아! 맞다!!' 하고 찍음ㅠㅠ 라고 하기엔 너무 다 먹고 찍었넼ㅋㅋㅋㅋㅋㅋㅋ 누나가 1박2일로 놀러가서 아빠가 차려주셨다. 메뉴는,,,, 저번에 누나가 해줬던 카레!!와 그리고 각종 반찬. 큰 그릇 옆에 있는 작은 그릇은 아빠가 남은 카레에 물 넣고 스프 조금 넣어서 끓여주신 카레라면..