ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • [이펙티브 자바] item 6 - 불필요한 객체 생성을 피하라
    개발서적읽기/Effective Java 3E 2020. 6. 22. 21:15

    ■String 리터럴을 이용한 불필요 객체 생성 방지


    - 불필요한 객체 생성

    String s = new String("bikini");

    이 문장은 실행될 때마다 String 인스턴스를 새로 만든다. 완전히 쓸떼없는 행위다.


    생성자에 넘겨진 "bikini" 자체가 이 생성자로 만들어내려는 String과 기능적으로 


    완전히 똑같다. 아래는 문제점을 개선한 코드다.

    String s = "bikini";

    이 코드는 새로운 인스턴스를 매번 만드는 대신 하나의 String 인스턴스를 사용한다.


    그리고 같은 가상 머신 안에서 이와 똑같은 문자열 리터럴을 사용하는 모든 코드가


    같은 객체를 사용함이 보장된다. (String constant pool in Heap)




    정적 팩터리 메서드를 이용한 불필요 객체 생성 방지


    생성자 대신 정적 팩터리 메서드를 제공하는 불변 클래스에서는 


    정적 팩터리 메서드를 사용해 불필요한 객체 생성을 피할 수 있다.


    생성자는 호출할 때마다 새로운 객체를 만들지만, 팩터리 메서드는 그렇지 않기 때문이다.


    Boolean.valueOf()가 바로 그 예이다. 


    (Boolean 생성자는 Java 9에서 deprecated API로 지정되기도 했다.)


    불변 객체만이 아니라 가변 객체라 해도 사용 중에 변경되지 않을 것임을 안다면 


    재사용할 수 있다.




    ■캐싱을 이용한 불필요 객체 생성 방지


    생성 비용이 아주 비싼 객체인 경우, 그리고 이 '비싼 객체'가 반복해서 필요하다면


    캐싱하여 재사용하길 권한다. 아래 정규식 코드를 살펴보자.

    static boolean isRomanNumeralSlow(String s) {
    return s.matches("^(?=.)M*(C[MD]|D?C{0,3})"
    + "(X[CL]|L?X{0,3})(I[XV]|V?I{0,3})$");
    }

    이 코드의 문제점은 String.matches 메서드를 사용한다는 데 있다.


    String.matches는 정규표현식으로 문자열 형태를 확인하는 가장 쉬운 방법이지만,


    성능이 중요한 상황에서 반복해 사용하기엔 적합하지 않다.


    이 메서드가 내부에서 만드는 정규표현식용 Pattern 인스턴스는 

    public boolean matches(String regex) {
    return Pattern.matches(regex, this);
    }
    public static boolean matches(String regex, CharSequence input) {
    Pattern p = Pattern.compile(regex);
    Matcher m = p.matcher(input);
    return m.matches();
    }

    한 번 쓰고 버려져서 곧바로 가비지 컬렉션 대상이 된다. 


    Pattern은 입력받은 정규표현식에 해당하는 유한 상태 머신(finite state machine)을 


    만들기 때문에 인스턴스 생성 비용이 높다. 


    (유한 상태 머신이란 용어 그대로 '유한한 상태들로 구성된 기계' 라고 한다)


    따라서 성능을 개선하려면 필요한 정규표현식을 표현하는 불변의 Patternm 인스턴스를


    클래스 초기화(정적 초기화) 과정에서 직접 생성해 캐싱해두고, 나중에 


    isRomanNumeral 메서드가 호출될 때마다 이 인스턴스를 재사용한다.


    public class RomanNumerals {
    private static final Pattern ROMAN = Pattern.compile(
    "^(?=.)M*(C[MD]|D?C{0,3})"
    + "(X[CL]|L?X{0,3})(I[XV]|V?I{0,3})$");

    static boolean isRomanNumeralFast(String s) {
    return ROMAN.matcher(s).matches();
    }
    }

    이렇게 개선하면 isRomanNumeral이 빈번히 호출되는 상황에서 성능을 상당히


    끌어올릴 수 있다. 


    코드도 더 명확해졌다. 개선 전에서는 존재조차 몰랐던 Pattern 인스턴스를 


    static final 필드로 끄집어내고 이름을 지어주어 코드의 의미가 훨씬 잘 드러난다.


    한편, 개선된 isRomanNumeral 방식의 클래스가 초기화된 후 이 메서드를


    한 번도 호출하지 않는다면 ROMAN 필드는 쓸떼없이 초기화된 꼴이다.


    isRomanNumeral 메서드가 처음 호출될 때 필드를 초기화하는 


    지연 초기화(lazy initialization, item 83)로 불필요한 초기화를 없앨 수는 있지만


    권하지는 않는다. 지연 초기화는 코드를 복잡하게 만드는데, 성능은 크게 개선되지


    않을 때가 많기 때문이다. (item 67)




    ■어댑터를 사용한 불필요 객체 생성 방지


    이부분을 이해하는데 꽤 시간이 걸렸다. (이부분의 해석이 약간 이상한것 같다.)


    객체가 불변이라면 재사용해도 안전함이 명백하다.


    어댑터를 한번 떠올려보자. 어댑터는 실제 작업은 뒷단 객체에 위임하고, 


    자신은 제2의 인터페이스 역할을 해주는 객체다. 어댑터는 뒷단 객체만 관리하면 된다.


    즉, 뒷단 객체 외에는 관리할 상태가 없으므로 뒷단 객체 하나당 어댑터 하나씩만 


    만들어지면 충분하다. 예컨대 Map 인터페이스의 keySet 메서드는 호출될 때마다 


    같은 Set 인스턴스를 반환한다. 

    public class HashMap<K, V> extends AbstractMap<K, V> 
    implements Map<K, V>, Cloneable, Serializable {
    public Set<K> keySet() {
    Set<K> ks = keySet;
    if (ks == null) {
    ks = new KeySet();
    keySet = ks;
    }
    return ks;
    }
    }
    public class ConcurrentHashMap<K, V> extends AbstractMap<K, V>
    implements ConcurrentMap<K, V>, Serializable {
    public KeySetView<K, V> keySet() {
    KeySetView<K, V> ks;
    return (ks = keySet) != null ? ks : (keySet = new KeySetView<K, V>(this, null));
    }
    }

    이 Set 인스턴스의 상태에 변경이 일어나면, 뒷단 객체에 해당하는 Map 인스턴스도


    맞춰서 상태 변경이 일어난다. 


    keySet이 Set 인터페이스를 매번 새로 만들어도 상관은 없지만, 


    그럴 필요도 없고 이득도 없다.


    이 부분에 관해서 백기선님의 이펙티브 자바 유튜브 강의를 봤다.


    그런데 백기선님은 견해가 달랐다


    keySet 으로부터 받은 Set 인스턴스가 다른 곳에서도 사용중이고 심지어 상태값을 


    변화시킨다면 현재 내가 사용중인 Set 인스턴스와 Map 인스턴스의 값에 


    확신을 할 수 없다. 그렇기 때문에 매번 복사해서 새로운 객체를 반환하도록 


    하는(item 50) 방어적 복사 방식을 선호한다고 했다.


    나도 백기선님의 견해에 동의한다. 상황에 따라 다르겠지만, 일반적으로 


    Set 인터페이스가 매번 생성된다고 해도 성능에 치명적이지 않을 것 같다.


    오히려 Map 인스턴스와 Set 인스턴스를 Immutable하게 사용하는 것이 


    유지보수 하는데 더 많은 이점을 가져다 줄 것 같다.




    ■기본 타입을 이용한 불필요 객체 생성 방지


    불필요한 객체를 만들어내는 또 다른 예로 오토박싱(auto boxing)을 들 수 있다.


    오토박싱은 개발자가 기본 타입과 박싱된 기본 타입을 섞어 쓸 때 자동으로 


    상호 변환해주는 기술이다. 오토박싱은 기본 타입과 그에 대응하는 박싱된


    기본 타입의 구분을 흐려주지만, 완전히 없애주는 것은 아니다. 


    의미상으로는 별다를 것 없지만 성능에서는 그렇지 않다 (item 61)

    private static long sum() {
    Long sum = 0L;
    for (long i = 0; i <= Integer.MAX_VALUE; i++)
    sum += i;
    return sum;
    }

    이 프로그램은 정확한 답을 낸다. 


    하지만 Long으로 선언된 변수를 long으로 바꾸면 훨씬 더 빠른 프로그램이 된다. 


    위 코드는 sum 변수를 Long으로 선언했기 때문에 불필요한 Long 인스턴스가 


    약 231개나 만들어진다. (long 타입인 i가 Long 타입인 sum에 더해질 때마다 생성된다.)


    박싱된 기본 타입보다는 기본 타입을 사용하고, 의도치 않은 오토박싱이 


    숨어들지 않도록 주의하자.




    ■오해금지


    이번 아이템을 "객체 생성은 비싸니 피해야 한다"로 오해하면 안 된다.


    특히나 요즘의 JVM에서는 별다른 일을 하지 않는 작은 객체를 생성하고 회수하는 일이


    크게 부담되지 않는다. 프로그램의 명확성, 간결성, 기능을 위해서 객체를 추가로


    생성하는 것이라면 일반적으로 좋은 일이다.




    ■그렇다고 자신만의 객체 풀(pool)을 만들지는 말자


    아주 무거운 객체가 아닌 이상, 단순히 객체 생성을 피하기 위해 자신만의 


    객체 풀(pool)을 만들지는 말자. 


    DB 커넥션 같은 경우 생성 비용이 워낙 비싸니 재사용하는 편이 낫다.


    하지만 일반적으로는 자체 객체 풀은 코드를 헷갈리게 만들고 메모리 사용량을 늘리고 


    성능을 떨어뜨린다. 요즘 JVM의 GC는 상당히 잘 최적화되어서, 가벼운 객체를 다룰 때는


    직접 만든 객체 풀보다 훨씬 빠르다.




    ■재사용하자 vs 재사용하지 말자


    이번 아이템은 객체를 재사용할 것을 지향한다.


    하지만 item 50은 방어적 복사를 통해 재사용을 지양한다.


    두개를 비교해본다면, 전자보다 후자가 훨씬 치명적이다. 


    왜냐하면 성능 문제는 물론이고 동기화 관련한 이슈가 발생할 수 있고 


    보안에 구멍이 뚫릴수도 있기 때문이다.


    가장 최선은 객체를 재사용할지, 방어적 복사를 통해 재사용을 안할지 


    상황에 맞춰 '잘' 판단하는 것이다.

    댓글

Designed by Tistory.