산업데이터 분석

    배터리 충방전 데이터를 활용한 배터리 수명 및 불량 예측
    공정혁신 에너지
    배터리 충방전 데이터를 활용한 배터리 수명 및 불량 예측

    A123 충방전 데이터를 활용하여 사람의 접근이 어려운 영역에서의 고장을 사전에 방지하고, 빠른 피드백을 통해 배터리 고장에 의한 시스템 작동 중단을 막아 유지보수 비용 뿐 만 아니라 제품 생산성 저하로 인해 발생하는 시스템의 손실 비용을 절감할 수 있다.124개의 상업용 리튬-철-인산염/흑연 셀로 구성된 데이터를 활용하여 회귀 분석과 로직스틱 회귀 분석을 진행했다.첫째, MAT파일인 124개의 셀의 데이터 확인을 위해 파이썬을 사용하여 PKI파일로 변환 하고, 전처리를 진행한 후 데이터의 특성을 이해했다.둘째, 논문에서 중요한 요소라 한 △Q(V)라는 변수 값을 파이썬을 사용하여 Minimum, Mean, Maximum ... 등 여러 △Q(V)에 관계된 지표로 생성했다.셋째, 상관 분석을 통해 생성된 지표들 중 유의미한 지표를 찾고, 찾은 지표를 사용하여 배터리 수명 및 불량 예측을 진행했다. 2023-12-12

    세포 정밀 검사 서비스 개발을 위한 유방암 악성종양 예측 및 원인진단
    서비스고도화 헬스케어
    세포 정밀 검사 서비스 개발을 위한 유방암 악성종양 예측 및 원인진단

    위스콘신 유방암 진단결과 데이터를 활용하여 양성종양인지 악성종양인지 예측 및 원인 진단을 할 수 있다. UCI에서 제공하는 오픈 데이터를 활용하여 분류 예측 분석을 진행했다.첫째, 데이터를 확인하여 양성과 음성의 데이터 수를 확인했다. 둘째, 문자 형태인 diagnosis 변수의 값을 숫자 형태로 변환하고, 필요 없는 컬럼은 제거, Z-정규화를 진행했다. 셋째, EDA와 상관분석을 통해 분류 모델에 적합한 컬럼 선정하여 분류 예측 분석을 진행하고, 업샘플링을 통해 분류 예측 분석을 재 진행하여 모델 성능을 개선했다. 넷째, 모델을 통해 중요도가 높은 상위 5개의 변수의 특징을 양성/음성별로 확인했다. 2023-12-12

    반도체 주요공정 합격/불합격 예측
    공정혁신 기계·로봇
    반도체 주요공정 합격/불합격 예측

    반도체 센서 데이터와 주요공정 합격 불합격여부를 활용하여 공정 합격/불합격 여부를 예측할 수 있다. 특정센서의 관련장비를 미리 관리하여 공정 합격율을 높일 수 있다. UCI에서 제공하는 오픈 데이터를 활용하여 분류 예측분석을 진행했다. 첫째, 데이터를 확인하여 결측치, 이상치의 여부를 파악하고 반도체 센서데이터의 형태를 이해했다. 둘째, 반도체 센서와 합격/불합격 여부의 상관 분석을 통해 상관성이 상위 40개의 반도체 센서들을 선정했다. 셋째, 데이터 분류 예측을 진행하기 위해 스케일링, 업샘플링 등의 전처리 과정을 수행했다. 넷째, 공정 불합격일 때 센서데이터의 변화 및 패턴이 존재하는지 시각화를 통해 확인하여 공정 불합격을 예방할 수 있는 전략을 수립한다. 2023-12-12

    의류공장 직원의 생산성 하락 원인파악을 위한 생산성 예측
    공정혁신 섬유·화학
    의류공장 직원의 생산성 하락 원인파악을 위한 생산성 예측

    의료공장 재봉 공정의 팀별 생산성 데이터를 활용하여 생산성이 떨어지는 요인을 미리 개선하여 품질 관리 전략을 수립할 수 있다. UCI에서 제공하는 오픈 데이터를 활용하여 분류예측 분석을 진행했다. 첫째, 데이터를 확인하여 결측치, 이상치의 여부를 파악하고 데이터의 특성을 이해했다. 둘째, 결측치 제거, 이상치 제거, 스케일링 등 전처리를 수행하고 회귀 예측분석을 진행했다. 셋째, 모델 성능 개선 및 실업무에 활용성을 더하기 위해 생산성을 범주화하여 스케일링, 업샘플링 등의 전처리를 재 진행 후 분류 예측분석을 진행했다. 넷째, 생산성과 관련 있는 주요변수의 데이터를 파악하여 공정개선 및 품질관리 활용방안을 마련한다. 2023-12-12

    가정 에너지 관리를 위한 가구 전력 사용량 패턴 파악
    신산업/BM 창출 에너지
    가정 에너지 관리를 위한 가구 전력 사용량 패턴 파악

    효율적인 에너지 관리를 위해서는 우선 전력 사용량 패턴을 파악해야 한다. UCI에서 제공하는 오픈 데이터를 활용하여 가구 전력 소비량 분석을 진행했다. 첫째, 데이터를 확인하고 결측치를 처리하여 분석이 가능한 형식으로 데이터를 가공했다. 둘째, 연도별, 요일별, 월별, 시간별로 그룹연산하여 각 시기별 패턴을 파악했다. 2022-11-22

    산업 전력 소비량 데이터를 활용한 CO2 발생량 예측
    서비스고도화 철강
    산업 전력 소비량 데이터를 활용한 CO2 발생량 예측

    무효전력은 연결된 부하에서 소비되지 않고, 발전소와 부하 사이를 왔다 갔다 하는 전력을 의미하고 역률은 전류가 단위 시간에 하는 일의 비율을 의미한다. 해당 데이터로 CO2배출량에 영향을 미치는 변수들을 분석하여 CO2배출량을 줄이기 위한 철강 산업 CO2 배출량 예측모델을 학습했다.첫째, EDA를 통해 데이터의 특성을 파악했다. 둘째, 상관분석을 통해 CO2배출량과 높은 상관관계를 갖는 변수를 추출했다. 셋째, 여러 모델을 학습하여 성능지표를 비교한 후 가장 성능이 좋은 학습모델로 CO2배출량을 예측하여 실제값과 예측값을 비교했다. 넷째, 모델 학습에 높은 영향을 준 변수와 상관분석을 통해 파악한 상관관계가 높은 변수들을 시각화하여 인사이트를 도출했다. 2022-11-21