[Python] 중복된 데이터 처리
📌 ### 중복데이터 처리 df = pd.DataFrame({"c1":['a','a','b','a','b'], "c2":[1,1,1,2,2], "c3":[1,1,2,2,2]}) df # duplicated() : 중복데이터 찾기. # 중복된 경우 중복된 두번째 데이터부터 True로 리턴 # 전체 행을 기준으로 중복 검색 df_dup = df.duplicated() df_dup df[df_dup] # 중복된 데이터만 조회 # c1컬럼을 기준으로 중복 검색 df["c1"].duplicated() # c1컬럼을 기준으로 중복 검색 col_dup = df["c1"].duplicated() df[col_dup] # 중복된 데이터 제거하기 # drop_duplicates() : 중복된 행을 제거하기 df # df ..
2023. 4. 25.
[Python] numpy 연산
📌 ### numpy 데이터 연산 # 1차원 배열의 연산 # 빼기 a = np.array([20,30,40,50]) b = np.arange(4) # (0,1,2,3) c = a-b # 각각의 요소들을 연산 c # array([20, 29, 38, 47]) # 더하기 c = a+b # 각각의 요소들을 연산 c # array([20, 31, 42, 53]) # 제곱 c = b**2 # b 요소들 각각의 제곱 c # array([0, 1, 4, 9], dtype=int32) # < 사용 c = a < 35 # a 배열의 요소를 35와 비교하여 작으면 True, 크면 False c # array([ True, True, False, False]) # 2차원 배열의 연산 a = np.array([[1,1],[0..
2023. 4. 25.