두 용어 모두 개념이 비슷함. 다만 서로 다른 연구 분야에서 기인했음.

여기에 한국어 용어까지 더해지면서 헷갈림의 대환장 파티가 벌어짐.

사실상 기억해야 하는건

1. (진단/실제참거짓) 두가지 요인에 의한 4가지 조합(TP/FP/FN/TN) +연구분야에따른 용어 차이.

2. 각자 조합에 해당하는 한국어 용어(ex. 민감도,위양성율,특이도)

3. 조합간의 상관관계(ex. FPR/TPR은 비례한다) -> 아래 그림, 예시로 이해하면 편함.

4. 사용하는 metric들의 정의

 

1.FAR/FRR

FAR/FRR은 생체인식 부분에서 쓰임

FAR = False Acceptance Rate : 잘못함(우선 답하고 다름) + Acceptance(허용함) -> 허용했는데 잘못함 -> 원래 거절해야하는데 허용함.

FRR = False Rejection Rate : 잘못함(우선 답하고 다름) + Rejection(거절함) -> 거절했는데 잘못함 -> 원래 허용해야하는데 거절

행동/정답 Acceptance Rejection
Acceptance 잘함 True Acceptance  못함 False Acceptance
Rejection 못한 False Rejection 잘함 True Rejection

함.

 

2.False Positive/ False Negative

: IDS(Intrusion Detection System, 침입방지 시스템)에서 기인함.

위 내용과 비슷. 자세히는

False Positive( 알람이 울렸으나 잘못함 -> 공격이 발생하지 않았으나 알람 울림)

False Negative( 알람이 안울렸으나 잘못함 -> 공격이 발생하였으나 알람 안울림)

행동/정답 True False
Positive 잘함 True Positive= 민감도,양성율 못함 False Positive=위양성율
Negative 못함 False Negative 잘함 True Negative = 특이도

3. TPR/FPR(민감도,특이도=TAR/FAR)

:위의 네가지 용어(두 분야라 총 8가지)중 TPR/FPR은 대부분의 classification에서 사용하는 metric인 ROC curve를 그리는데 사용한다. TPR/FPR은 서로 비례하는 관계가 있으므로 curve를 그려 성능을 확인한다. 자세한건 6.단락 확인

-TPR : True Positive Rate(민감도)

-FPR : False Positive Rate(1-특이도)

4.Acc/Precision/Recall/F1

~classfier에는 한 metric으로 무조건 좋다 나쁘다를 판단하기 힘들다. 실제 태스크를 보고 중요한 metric을 골라야 한다.

 보통 쓰는 metric에는 Precision/Recall/F1/Acc이 있다. 

 -Acc = (TP+TN)/(TP+TN+FN+FP)  : 전체중에 옳게 판단한 비율  

 -precision =TP/(TP+FP) : 참이라고 판단한것중 실제로도 참인 비율

 -Recall = TP/(TP+FN) : 실제참인것들중 참이라고 판단한비율  

 -F1 = 2*(Precision*Recall)/(Precision + Recall)

       : Precision과 Recall의 balnce를 찾고싶을때 사용 병의 진단같은경우처럼 다수의 True negative의 수가 많고 중요         한 정보가 아니고 FN과 FP에 좀더 중요성을 싣고 싶을때 사용.(uneven class distribution일때)

 -AUC=ROC curve의 밑면적(Area Under a ROC Curve), [0,1]의 범위, 1에 가까울수록 좋음. 아래 그림 참조.

출처 : https://newsight.tistory.com/53

 

5. 중요한 이슈

생체인식같은경우 -> FAR (다른사람 침입했는데 accept 해줌) ->인증보안 실패

IDS 같은경우 -> False Negative (공격했는데 알람 안울림) -> 공격감지 실패

 

6. 경향성

1,2번 모두 Threshold 에 대한 문제.

출처 : https://en.wikipedia.org/wiki/Sensitivity_and_specificity

-IDS : 알람에 대한 기준을 높이면 False Positive는 줄어들지만 True Positive도 같이줄어듦 or False Negative도 같이 올라감.  -> 민감도를 낮추면 오경보 횟수도 줄어들지만 실제 적이 침입했을때 경보를 안울릴 확률도 올라감.

 

-생체인식 : 보안 기준을 높이면 False acceptance는 줄어들지만 True acceptance도 같이 줆어듦 or False rejection도 같이 올라감

             -> 기준을 높이면 다른사람 침입을 잘 막지만 내가 들어가고싶을때도 막을 확률이 올라감.

 

 

FAR줄임-> TAR줄어듬 의 경향성이 있으므로 성능을 측정하거나 비교할때는 보통 아래와 같은 두가지 방법 사용.

 

1) ROC curve를 그림

출처 : https://en.wikipedia.org/wiki/Receiver_operating_characteristic

2) TAR@FAR=1% 같은 조건을 걸고 성능 측정

출처 : https://www.slideshare.net/ifkakao/ss-115328045

7. 보충

-완벽한 classifier는 TAR1@ FAR 0 -> ROC curve에서 왼쪽 위 = IDS 사진에서 두 분포가 완전히 분리 되어 두분포 사이에 경계 기준을 세울때. 아래 그림 참조

 

-ROC AUC=AUROC

-PR_AUC = Precision과 Recall 의 curve에 대한 면적 , ROC AUC와 개념은 비슷하나 상대적으로 ROC_AUC가 robust한 성능평가가 가능한것으로 알려져있다. 하지만 data imbalnce가 심한경우, PR_AUC를 쓰는것이 좋다.    

 

-micro F1 score= 전체 class에서 한번에 precision, recall을 구해서 f1을 구함 -> Accuracy와 동치.

-macro F1score= class별로 f1구한후 산술평균

 

 

보충부분 출처 : newsight.tistory.com/53

 

ROC curve, ROC_AUC, PR_AUC, 민감도, 특이도

ROC curve (Receiver Operating Characteristic curve) : FPR과 TPR을 각각 x,y축으로 놓은 그래프. ROC curve는 X,Y가 둘다 [0,1]의 범위이고, (0,0) 에서 (1,1)을 잇는 곡선이다. - ROC 커브는 그 면적이 1에..

newsight.tistory.com

틀리거나 궁금한점 있으시면 댓글 남겨주세요!

'인공지능 > 기타' 카테고리의 다른 글

뇌출혈(Intracranial hemorrhage) 정리  (0) 2021.02.01

+ Recent posts