Zalacznik krotki opis |
oprogramowanie do przeprowadzania analiz ekonometrycznej
Oprogramowanie do przeprowadzania analiz ekonometrycznej posiadające:
1. W obszarze danych:
• Wsparcie dla zmiennych numerycznych, alfanumerycznych i przedziałów czasowych
• Rozbudowaną bibliotekę funkcji matematycznych, statystycznych i tekstowych
• Obsługę transformacji danych
• Bibliotekę danych testowych
• Wsparcie dla konwersji na typ własny z różnych formatów arkuszy kalkulacyjnych, statystycznych i baz danych, w tym (ale nie wyłącznie): pliki Microsoft Access® i Excel® (w tym .XSLX i .XLSM), Gauss Pliki danych, pliki SAS® Transport, pliki rodzime i przenośne SPSS, Stata pliki, Tableau®, surowy tekst ASCII lub pliki binarne, HTML lub bazy danych ODBC i kwerend.
• Wsparcie dla standardu OLEDB
• Wsparcie dla baz danych FRED® (Federal Reserve Economic Data), Bank Światowy i bazy danych EuroStat, Global Insight DRIPro i DRIBase, Haver Analytics® DLX®, FAME, EcoWin, Bloomberg®, EIA®, CEIC®, Datastream®, FactSet® i Moody's Economy.com.
2. W obszarze szeregów czasowych:
• Obsługę dat i szeregów czasowych (zarówno regularnych, jak i nieregularnych).
• Specjalistyczne funkcje i operatory szeregów czasowych: opóźnienia, różnice, różnice logarytmiczne, średnie ruchome itp.
• Funkcję konwersji częstotliwości: różne metody o wysokiej do niskiej i niskiej do wysokiej.
• Wsparcie wygładzania wykładniczego: pojedyncze, podwójne, Holt-Winters i wygładzanie ETS.
• Wbudowane narzędzia do regresji wybielającej.
• Filtrowanie Hodricka-Prescotta.
3. W obszarze statystyki:
• Wsparcie dla testów: ANOVA (zrównoważone i niezrównoważone, z lub bez heteroskedastycznych wariancji), Wilcoxon, Mann-Whitney, Median Chi-square, Kruskal-Wallis, van der Waerden, test F, Siegel-Tukey, Bartlett, Levene, Brown -Forsythe.
• Wsparcie dla analiza kowariancji i korelacji, w tym porządek rang Pearsona, Spearmana, tau-a i tau-b Kendalla oraz analiza częściowa.
• Histogramy, wielokąty częstotliwości, wielokąty o częstotliwości krawędzi, średnie przesunięte histogramy, kwantyle ocalałego CDF, kwantyle-kwantyle, gęstość jądra, dopasowane rozkłady teoretyczne, wykresy boków.
• Wsparcie dla autokorelacji, autokorelacji cząstkowa, korelacji krzyżowej, statystyki Q.
• Testy przyczynowości Grangera, w tym przyczynowość Grangera.
• Testy pierwiastkowe: Rozszerzony Dickey-Fuller, GLS przekształcony Dickey-Fuller, Phillips-Perron, KPSS, Eliot-Richardson-Stock Point Optimal, Ng-Perron, a także testy dla pierwiastków z punktami przerwania.
• Testy kointegracyjne: Johansen, Engle-Granger, Phillips-Ouliaris, stabilność Hansena.
• Testy niezależności: Brock, Dechert, Scheinkman i LeBaron
4. W obszarze oszacowania:
• Wsparcie dla metod regresji.
• Wsparcie dla modeli ARMA and ARMAX
• Wsparcie dla zmiennych instrumentalnych i GMM
• Wsparcie dla równań ARCH/GARCH
• Wsparcie dla Modeli z ograniczoną zależnością zmiennych
• Wsparcie dla danych panelowych / połączeń szeregów czasowych, danych przekrojowych
• Wsparcie dla uogólnionych modeli liniowych
• Wsparcie dla regresji kointegracji pojedynczego równania
5. W obszarze równań:
• Wsparcie dla VAR/VEC
• Wielowymiarowy ARCH
Poza możliwością dokonywania analiz statystycznych przy użyciu interfejsu graficznego oprogramowanie powinno umożliwiać szczegółową modyfikację oraz automatyzację zadań związanych z przetwarzaniem danych.
Oprogramowanie powinno umożliwiać pracę w środowisku Windows Wieczysta licencja komercyjna, udostępniona Zamawiającemu.
Produkty w/w oraz objęte zamówieniem będą używane w celach naukowych, realizowanych przez instytucję i nie będą wykorzystywane przy świadczeniu usług o charakterze komercyjnym na rzecz osób trzecich
|
Zalacznik krotki opis |
oprogramowanie do przeprowadzania analiz statystycznych
1. Oprogramowanie powinno umożliwiać import danych w różnych formatach, w tym co najmniej: Excel (XLS, XLSX), SPSS (SAV), oraz plików tekstowych za pomocą dedykowanego kreatora (TXT, DBF, ASCII, CSV).
2. Oprogramowanie powinno zapewniać dostęp do danych gromadzonych w ramach popularnych systemów bazodanowych za pomocą sterowników ODBC lub mechanizmu OLE DB. Dostęp do baz danych powinien być realizowany za pomocą kreatora pozwalającego tworzyć i zapisywać kwerendy w języku SQL.
3. Oprogramowanie powinno zapewniać możliwość kopiowania własności zmiennych w obrębie jednego zbioru danych oraz kopiowania własności pomiędzy zbiorami danych.
4. Oprogramowanie powinno dawać możliwość przeszukiwania i zastępowania w zbiorze danych określonych wartości (i ciągów tekstowych).
5. Oprogramowanie powinno zapewniać możliwość definiowania różnych rodzajów braków danych, w tym co najmniej braków odpowiadających odpowiedziom kwestionariusza: "nie wiem", "nie dotyczy" i "odmowa odpowiedzi".
6. Powinna istnieć możliwość zarządzania brakami danych co najmniej w zakresie:
a. Zastępowanie braków danych wartościami średniej, mediany, dominanty.
b. Wykorzystania mechanizmu wielokrotnej imputacji braków danych.
c. Wyłączania wszystkich obserwacji z brakami lub wyłączanie obserwacji parami.
7. Oprogramowanie powinno zapewniać możliwość podglądu z poziomu kreatora podstawowych informacji o zmiennej (typ zmiennej, etykieta zmiennej, poziom pomiaru, kategorie zmiennej - w przypadku zmiennych nominalnych i porządkowych). Utworzony zestaw wielokrotnych odpowiedzi musi być możliwy do użycia przy konstruowaniu obiektów tabelarycznych i budowaniu wykresów.
8. Musi być możliwe tworzenie zestawów wielokrotnych odpowiedzi, tj. obiektów łączących wartości pochodzących z różnych zmiennych, w których zakodowane są odpowiedzi na pytania wielokrotnego wyboru.
9. Oprogramowanie powinno zapewniać następujące funkcjonalności w zakresie przygotowania i przekształcania danych:
a. Podział zbioru danych na części, tak by analizy były automatycznie wykonywane dla różnych grup jednostek analizy (np. jednostek terytorialnych).
b. Selekcja losowa i warunkowa rekordów, permanentna lub tymczasowa - bez utraty zawartości zbioru danych (niewybrane rekordy pozostają nieaktywne – nie są brane pod uwagę podczas przekształcania danych i analizy).
c. Operacje wykonywane wg. zmiennych takie jak: zliczanie wystąpień określonych wartości lub przedziałów wartości w zestawie zmiennych, sumowanie wartości po zmiennych, wyciąganie wartości maksymalnej i minimalnej z zestawu zmiennych, wyliczanie średniej, mediany, odchylenia standardowego dla grup zmiennych.
d. Sortowanie rekordów na podstawie jednej lub większej liczby zmiennych.
e. Identyfikacja powtarzających się rekordów na podstawie pojedynczej zmiennej lub zestawu wybranych zmiennych.
f. Sprawdzanie poprawności danych poprzez:
• Weryfikację poprawności obserwacji obejmuje sprawdzenie identyfikatorów pod względem występowania braków danych i duplikatów oraz oznaczenie pustych obserwacji.
• Weryfikację poprawności zmiennych obejmuje między innymi oznaczenie zmiennych z dużą ilością braków danych i zmiennych z dużą liczbą kategorii mało licznych.
• poszukiwanie błędów logicznych i wartości spoza dopuszczalnego zakresu.
• wyliczanie dla każdej obserwacji indeksu anomalii, który mierzy nietypowość obserwacji z uwzględnieniem jej przynależności do grupy o zbliżonych wartościach.
g. Agregacja zbioru danych z użyciem co najmniej takich miar jak: suma, średnie, mediana, minimum, maksimum, odchylenie standardowe, liczba agregowanych rekordów, pierwsza i ostatnia w grupie. W przypadku agregacji oprogramowanie powinno dawać możliwość przypisania jako nowych zmiennych do istniejącego zbioru danych miar wyliczonych z wykorzystaniem funkcjonalności agregacji.
h. Restrukturyzacja zbioru danych, w tym co najmniej możliwe jest przekształcenie wybranych zmiennych w grupy powiązanych ze sobą obserwacji, przekształcenie grup obserwacji w zmienne oraz pełna transpozycja zbioru danych.
i. Rekodowanie zmiennych na te same zmienne lub na nowe zmienne.
j. Rekodowanie wartości zmiennych na podstawie liczebności kategorii w zbiorze danych, w taki sposób, że w wyniku rekodowania cecha najliczniej reprezentowana w danych otrzymuje najniższą/najwyższą wartość na nowej liście wartości, a kolejne wartości cechy w zależności od liczności uzyskują kolejne wartości numeryczne.
k. Automatyczne rekodowanie cech małolicznych w oparciu o zdefiniowane przez użytkownika kryteria, w celu ułatwienia analizy i bardziej przejrzystej prezentacji wyników. Na przykład kategorie cech, których reprezentacja w zbiorze jest mniejsza niż założona przez użytkownika zostają zgrupowane do kategorii „inne”(np. wszystkie wartości stanowiące poniżej 3%, zostają zgrupowane w ramach oddzielnej kategorii).
l. Kodowanie dychotomiczne, które pozwala w oparciu o wartości wybranej cechy przyjmującej określone wartości utworzyć zestaw zmiennych dychotomicznych, zawierających wartość informacyjną cechy wyjściowej.
m. Kategoryzacja wizualna zmiennych ilościowych z możliwością automatycznego wyboru punktów podziału (w oparciu o wyznaczenie równolicznych kategorii, percentyli, punktów przedstawiających miary odchylenia standardowego) i możliwością tworzenia etykiet opisujących granice przedziałów dla utworzonych kategorii
n. Automatyczne przekształcanie zmiennych tekstowych w zmienną numeryczną, gdzie kolejnym wartościom tekstowym np. "{Powiat X" ,"Powiat Y", "Powiat Z" itd. są przypisywane kolejne wartości 1,2,3 itd. Jednocześnie z wartości tekstowych są automatycznie tworzony etykiety wartości.
o. Kreator wyliczania nowych zmiennych przy użyciu funkcji arytmetycznych, daty i czasu, logicznych, statystycznych
p. Operacje na datach wyciągnie z daty: dni, miesięcy, kwartałów, roku, dnia tygodnia, dnia w roku, tygodnia. Tworzenie daty z oddzielnych zmiennych reprezentujących dzień, miesiąc, rok.
q. Ważenie rekordów wartościami wybranej zmiennej i rangowanie rekordów na podstawie wybranych zmiennych.
r. Standaryzacji lub też normalizacji zmiennych poprzez wskazanie odpowiednio wartości średniej i odchylenia standardowego dla zmiennych standaryzowanych lub wartości minimalnej i maksymalnej dla zmiennych normalizowanych.
s. Wyszukiwanie i usuwanie duplikatów rekordów oraz duplikatów zmiennych w zbiorze danych.
10. Oprogramowanie winno zapewniać co najmniej następujące techniki analityczne:
a. statystyki częstości i rozkładu zmiennych,
b. tabele krzyżowe z możliwością prezentacji miar współzależności zmiennych (liczebności obserwowane i liczebności oczekiwane, test Chi-kwadrat, Skorelowane zmienne V-Cramera, test proporcji kolumnowych),
c. statystyki ilorazowe dla zmiennych ilościowych,
d. porównywanie średnich,
e. korelacja zmiennych,
f. testy t-Studenta,
g. testy nieparametryczne: U Manna-Whitneya, Kołmogorowa-Smirnowa, McNemara, Kendalla,
h. jednoczynnikowa analiza wariancji,
i. analiza czynnikowa i analiza głównych składowych,
j. hierarchiczna analiza skupień i analiza skupień metodą k-średnich,
k. regresja liniowa, estymacja krzywej regresji,
l. analiza dyskryminacyjna,
m. analiza miar nierówności z następującymi indeksami: Gini, Hoover, Theil-T i Theil-L wraz z wizualizacją wyników analizy przy pomocy Krzywej Lorenza
n. analizy symulacyjne (Monte Carlo)
11. Oprogramowanie powinno umożliwiać konstruowanie tabel wykorzystujących trzy wymiary prezentacji danych: wiersze, kolumny i warstwy, w oparciu o interaktywny kreator – obsługiwany przy pomocy mechanizmu „przeciągnij i upuść” zapewniający podgląd układu tabeli w trakcie jej tworzenia. W ramach interfejsu oprogramowanie powinno zapewniać, co najmniej:
a. możliwość umieszczania w tabeli więcej niż jednej zmiennej poprzez ustawianie zmiennych obok siebie i ich zagnieżdżanie
b. możliwość sortowania wierszy etykiet lub statystyk
c. umieszczania w wierszach, kolumnach i warstwach podsumowań w zależności od prezentowanych statystyk (liczebności, procenty, statystyki opisowe).
d. możliwość prezentowania zestawów wielokrotnych odpowiedzi, obejmująca tworzenie tabel dla pytań kwestionariusza z możliwością wyboru wielu odpowiedzi, gdzie bazą do procentowania może być zarówno liczba respondentów, jak i liczba udzielonych odpowiedzi.
12. Oprogramowanie powinno zapewniać możliwość tworzenia wykresów z wykorzystaniem interaktywnego kreatora – obsługiwanego za pomocą mechanizmu „przeciągnij i upuść” zapewniającego podgląd układu wykresu w trakcie tworzenia.
13. W ramach interfejsu oprogramowanie powinno zapewniać, co najmniej przygotowanie następujących wykresów:
a. słupkowy,
b. histogram (w tym piramida populacyjna)
c. liniowy,
d. kołowy, pierścieniowy,
e. Różna Nightingale,
f. skrzynkowy,
g. rozrzutu, wielowymiarowy wykres rozrzutu,
h. radarowy, szeregu,
i. punktowy,
j. mapa natężeń,
k. wykres Marimekko,
l. wykres kaskadowy, wiolinowy
m. wykresy na mapach (mapa gradientów, słupkowe, kołowe, liniowe).
n. wykresy tabelowe, które umożliwiają połączenie wykresu (do wyboru co najmniej słupkowy, skrzynkowy, szeregu, nakładany, histogram) i tabeli prezentującej statystyki (do wyboru co najmniej minimum, maksimum, średnia, mediana, odchylenie standardowe)w ramach jednego obiektu raportowego,
o. wykresy ułatwiające tworzenie pulpitów menedżerskich, umożliwiające monitorowanie postępu realizacji założonego planu, typu: mierniki, termometry, kostki, tarcza,
14. Oprogramowanie powinno zapewniać następujące możliwości edycji utworzonych tabel i wykresów:
a. edytowanie elementów tabeli/wykresu i prezentowania statystyk w zależności od typu i charakteru wybranych zmiennych,
b. edytowania tabel/wykresów w zakresie: zmiany porządku kategorii (sortowanie na podstawie wartości, etykiet, statystyki, itp.),
c. edycji graficznej poszczególnych elementów tabeli/wykresu: wyświetlanie nagłówków, komentarzy, linii referencyjnych i innych elementów,
d. automatyczne kolorowanie komórek tabeli (gradientowe - w zależności od natężenia cechy oraz warunkowe - dla ustalonych wartości, a także pomijania kolorowania przekątnej),
e. możliwość tworzenia szablonów tabel i wykresów użytkownika oraz korzystania z predefiniowanych szablonów wizualizacji, umożliwiająca automatyzację raportowania z zachowaniem jednolitego standardu graficznego prezentacji wyników.
15. Oprogramowanie powinno zapewniać możliwość importowania i edycji map.
16. Wymagane jest, aby oprogramowanie dysponowało możliwością wizualizacji na mapach Polski, co najmniej w podziale na województwa i powiaty.
17. Oprogramowanie powinno zapewniać wygodny eksport obiektów wynikowych (tabel i wykresów), co najmniej do dokumentu Ms-Word, MS-Excel, MS-PowerPoint oraz do obiektów HTML. W przypadku wykresów konieczne jest z zachowanie formatowania (kolory, linie i obramowania), a w przypadku tabel posiadających warstwy, zachowanie możliwości wyboru czy eksportowana ma być tylko pierwsza widoczna warstwa tabeli, czy wszystkie warstwy jako kolejne tabele.
18. Oprogramowanie powinno posiadać kurs obsługi oprogramowania (samouczek) w tym:
prezentacje multimedialne traktujące o :
a) Wczytywanie danych
b) Operacje na danych
c) Operacje na zmiennych
d) Analizy i wykresy
e) Edycja wyników
f) Raportowanie
g) Dystrybucja raportów
h) Interfejs aplikacji
Produkty w/w oraz objęte zamówieniem będą używane w celach naukowych, realizowanych przez instytucję i nie będą wykorzystywane przy świadczeniu usług o charakterze komercyjnym na rzecz osób trzecich.
|