산업데이터 분석

    증상에 따른 주의도 및 질환 예측
    신산업/BM 창출 헬스케어
    증상에 따른 주의도 및 질환 예측

    41가지 질환과 131가지 증상으로 이루어진 4920개의 환자 데이터셋과 증상이 이틀 이상 지속되었을 때의 위험도를 나타낸 데이터셋, 두 개의 데이터를 사용하여 각 증상이 몇 개의 질환에서 발현됐는지를 파악해서 발생빈도 변수를 생성한다.증상의 위험도와 발생빈도를 주의해야하는 증상의 척도로 보고 두 변수를 곱한 값인 주의도 변수를 생성한 뒤, 해당 컬럼을 정렬해서 주의가 필요한 상위 10개의 증상을 확인하고 시각화 한다. 또한 주의도 변수를 적용하여 예시로 설정한 질환에서 발생가능한 증상의 종류와 주의도 분포를 파악한다.기존의 질환별 발생 증상 데이터로부터 가공하여 만든 데이터를 사용하여 의사결정나무 모델의 분류 방식으로 학습하고, 최종적으로 증상의 발현 유무로부터 발생 가능한 질환을 예측하는 것을 목표로 한다. 2021-12-07

    저합금강의 기계적 특성 예측
    공정혁신 철강
    저합금강의 기계적 특성 예측

    전체 강재에 함량된 합금원소의 비율이 5% 이하인 합금 강철을 뜻하는 저합금강의 조성비 및 기계적 특성으로 이루어진 데이터를 활용하여 합금강의 기계적 특성 예측 템플릿을 개발했다. 합금 데이터를 사용하여 데이터 간의 상관관계를 파악하고, 특성 범위에 따른 합금원소의 함유율을 파악한 뒤, 마지막으로 저합금강의 기계적 특성을 예측하는 모델을 학습해 보았다.첫째, 합금 품질의 중요한 지표 중 하나인 인장강도(Tensile strength)를 중점으로 합금 원소의 함유율 및 특성 사이의 상관 관계를 파악한다.둘째, 인장강도를 저·중·고 세 범위로 구분하여 각각의 경우에 함유된 합금원소의 실제 함유율과 합금원소 간의 비율을 파악 및 시각화 한다.셋째, 파악한 기계적 특성 간의 상관 관계를 기준으로 랜덤 포레스트 모델을 사용하여 학습하고, 최종적으로 합금강의 다른 기계적 특성 데이터로부터 인장강도를 예측해 보았다. 해당 데이터의 기계적 특성 중 인장강도, 내력, 연신율, 단면감소율, 온도는 서로 간에 높은 상관관계를 가지므로 변수를 변경해가며 동일한 템플릿에서 상호간의 예측이 가능하다. 2021-12-07

    고혈압 단계별 PPG 신호 특징 분석
    공정혁신 헬스케어
    고혈압 단계별 PPG 신호 특징 분석

    해당 데이터는 219명의 환자들의 신체 정보 데이터와 광용적맥파 데이터로 구성되어 있다. 그 중에서 광용적맥파(PPG) 데이터를 사용하여 분석을 진행했다.혈압이 증가하면 혈관 벽의 신전성이 감소하여 맥파 전달 시간이 감소한다. 또한 진폭이 길다는 것은 단위 시간당 조직 혈액량이 증가하는 것을 의미한다. 따라서 PPG 신호의 진폭(AM)은 조직 혈액량 증가에 비례하며, 맥파 전달 시간(PTT)은 혈압에 반비례한다는 점을 참고하여 이러한 연구 결과를 증명하는 분석을 진행했다.우선, 고혈압 단계별로 환자를 한 명씩 추출하여 각각의 PPG 신호를 평활화 하였다. 그 다음, PPG 신호의 최고점과 최저점을 찾아내어 진폭과 맥파 전달 시간을 구했다. 각각의 계산 결과값을 하나로 병합하여 막대 그래프로 시각화를 한 후, 고혈압 단계가 높을수록 진폭이 길고 맥파 전달 시간이 짧다는 점을 발견했다. 2021-12-07