Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Прикладное программирование » Вопросы программирования на FORTRAN (ФОРТРАН)

Модерирует : ShIvADeSt

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы

Открыть новую тему     Написать ответ в эту тему

akaGM

Platinum Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Обсуждаются все вопросы, связанные с программированием на ФОРТРАН, как общего так и конкретного характера.
Постарайтесь дать как можно больше информации о возникшей проблеме -- это в конце концов в ваших же интересах чтобы вам помогли...

прежде чем просить помощи в задании
платное решение задач

ресурсы этого топика
ссылка на подборку ресурсов, собранных посетителями этого форума
 
то, чем мы решили поделиться
ссылка на страничку программ etc собственного изготовления, которыми любезно делятся наши форумчане


если вам вдруг не отвечают или ответ вас не устраивает
и вообще полезно прочитать всем спрашивающим
 
просьба к пишущим и отвечающим все большие листинги оформлять тегом more
и отключать графические смайлики при размещении фортран-кода

Всего записей: 24052 | Зарегистр. 06-12-2002 | Отправлено: 18:11 14-01-2007 | Исправлено: akaGM, 09:47 01-03-2020
vaulin

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Andrew10

Цитата:
2n**3/3 - это для полнозаполненных матриц. А для трехдиагональных - как у Вас и получалось, разница по скорости должна быть не более, чем в два раза. Что касается библиотечной функции метода прогонки, то для комплексных неэрмитовых матриц вряд ли Вы ее найдете в известных библиотеках. Поскольку в этом случае устойчивость при использовании метода прогонки не гарантирована, то создатели библиотек предпочитают устойчивость скорости  

Хм, мне сейчас пришла мысль. Ведь метод прогонки - это ни что иное, как метод Гаусса! только для случая трехдиагональной матрицы. Т.е. ф-ия LSLTQ - это, фактически, прогонка, только с ведущим элементом. Только теперь не понятно, почему она в 2 раза дольше работает? неужели выбор ведущего элемента так сильно тормозит процедуру? Ведь выбор этого элемента - это, фактически, выбор максимального коэффициента из трех имеющихся!?

Всего записей: 80 | Зарегистр. 16-10-2008 | Отправлено: 13:49 10-11-2008
Andrew10

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
vaulin

Цитата:
Хм, мне сейчас пришла мысль. Ведь метод прогонки - это ни что иное, как метод Гаусса!

 
Совершенно верно. Почему программа работает медленнее Вашей реализации, можно понять посмотрев исходник. В документации к программе LSLTQ библиотеки IMSL есть указание, что она основана на программе CGTSL открытой библиотеки Linpack, исходники которой легко найти в сети. Видимо, все дело в особо "осторожной"  организации вычислений, которые должны избежать переполнений и потери точности.

Всего записей: 780 | Зарегистр. 26-02-2005 | Отправлено: 16:44 10-11-2008
akaGM

Platinum Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
vaulin

Цитата:
спасибо большое за снисхождение и терпение к моему невежеству

да ладно...
 

Цитата:
работает?
 
да, с учетом замечаний Andrew10, разумеется  

а что, компилятор у тебя это не отрабатывает?
а глазками?

Всего записей: 24052 | Зарегистр. 06-12-2002 | Отправлено: 16:55 10-11-2008
vaulin

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Andrew10

Цитата:
Хм, мне сейчас пришла мысль. Ведь метод прогонки - это ни что иное, как метод Гаусса! ... LSLTQ - это, фактически, прогонка, только с ведущим элементом

... эх ... и все-таки, это не прогонка. Суть, конечно, одна как у метода Гаусса, так и у прогонки - последоват. искл. перемен., но реализации разные, эх ... слишком разные. Скачал с http://www.netlib.org/slatec/lin/cgtsl.f исходник CGTSL, работает чуть быстрее LSLTQ. Интересно получилось (для расчетной сетки 8192*4000): метод прогонки - 5 с, LSLTQ - 22 с, CGTSL - 20 с.
Andrew10, интересно, а св-во симметрии матриц дает к.-л. выигрыш при расчетах? есть ли, например, такие библиотечные ф-ии, или алгоритмы, для симметричных матриц с диагональным преобладанием?
 
 
Добавлено:
Кто-н. знает, можно ли из командной строки компилировать сразу несколько файлов как при проекте, создавая единый *.exe?

Всего записей: 80 | Зарегистр. 16-10-2008 | Отправлено: 11:39 12-11-2008
akaGM

Platinum Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
vaulin
какие проблемы?

Код:
fortran_compiler.exe file.f file.for file.f90 file1.f file1.for file1.f90 file2.obj file2.lib /out:myexe.exe

или что?

Всего записей: 24052 | Зарегистр. 06-12-2002 | Отправлено: 13:31 12-11-2008 | Исправлено: akaGM, 13:32 12-11-2008
Andrew10

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
vaulin

Цитата:
Andrew10, интересно, а св-во симметрии матриц дает к.-л. выигрыш при расчетах? есть ли, например, такие библиотечные ф-ии, или алгоритмы, для симметричных матриц с диагональным преобладанием?  

 
Дает.  
Если матрица симметричная с диагональным преобладанием и диагональные элементы положительные, то это достаточное условие для положительной определенности, и можно пользоваться соответствующими модулями из Linpack или LAPACK для трехдиагональных симметричных положительно определенных или, в комплексном случае, эрмитовых матриц.
Конкретные имена подпрограмм можно посмотреть в документации к этим пакетам, или установить MKL, куда входит LAPACK. MKL библиотеки оптимизированы под Intel-процессор.
Где взять MKL можно узнать здесь:
http://forum.ru-board.com/topic.cgi?forum=35&topic=4530&start=546  
Впрочем, наверное, последние версии MKL не будут работать с CVF-6.6, так что нужно будет искать одну из предыдущих. Вроде бы MKL-7 должен работать.

Всего записей: 780 | Зарегистр. 26-02-2005 | Отправлено: 15:31 12-11-2008
Vskazka

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
vaulin
Andrew10
Наличие тех или иных программ - вторично. На самом деле основное достоинство симметричных матриц, что для задач с ними можно предложить алгоритмы с достаточно хорошими свойствами устойчивости по отношению к ошибкам округления и тп. При этом понятно, что мы получаем в ответе и с какой точностью. Можно оценить сие.  
Эта "ущербность" несимметричных матриц  лучше всего видно на примерах задач о нахождении собственных чисел. Существует пример матрицы 10*10, изменение одного элемента на 10^{-16}, то есть по сути ни на что ( если добавить к единице двойной точности то ничего не будет), влечет за собой изменение собственного числа на единицу.

Всего записей: 382 | Зарегистр. 24-11-2003 | Отправлено: 15:56 12-11-2008
Andrew10

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Vskazka

Цитата:
Наличие тех или иных программ - вторично.

Человек спрашивал про программы, про программы был и ответ

Всего записей: 780 | Зарегистр. 26-02-2005 | Отправлено: 16:08 12-11-2008 | Исправлено: Andrew10, 16:09 12-11-2008
vaulin

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
akaGM

Цитата:
Код:fortran_compiler.exe file.f file.for file.f90 file1.f file1.for file1.f90 file2.obj file2.lib /out:myexe.exe  

Да, я тупой. Ничего не понял А теперь для чайников, что такое fortran_compiler.exe? где это взять; df что ли здесь не нужен? file2.obj - откуда это взять? предварительная компиляция? Может лучше взять пример попроще? Как, к примеру, обработать совместно файл f1.for, где содержатся подпрограммы и модули, с файлом f2.for, в кот. содерж. главная программа (откуда вызываются эти самые подпрограммы и модули)?
Vskazka

Цитата:
Наличие тех или иных программ - вторично

согласен. Максимальный выигрыш можно получить, изменив алгоритм, а не его реализацию.
 А вообще, Andrew10 и Vskazka, большое спасибо! за ценную информацию, как "переварю" -- отпишусь. А пока еще, кому интересно, задачка по фортрану. Мне необходимо сравнить по времени различные операции (+,-,...). Есть подозрение, что обращение к элементам массива куда больше занимает времени, чем, к примеру, "+".
Написал в Far следующую программку (большое спасибо Andrew10 и akaGM за помощь в отладке ком. строки):
 
 integer*8,parameter:: n=9223372036854775800
 integer*8 i,j,k,l,m,p,r
 REAL(8):: start_time1,finish_time1,timer
 real*8 tmp1r
 complex(4):: c1=(1.0,1.0), ca(2000)=(1.0,1.0)
 
 start_time1=timer()
  do p=1,n; do r=1,n; do m=1,n; do l=1,n; do k=1,n; do j=1,n; do i=1,n
c1=c1+c1+c1+c1+c1+c1+c1+c1+c1+c1+c1+c1+c1+c1+c1+c1+c1+c1+c1+c1+c1+c1+c1+c1+c1+c1+c1+c1  
  enddo; enddo; enddo; enddo; enddo; enddo; enddo
 finish_time1=timer() !время конца вычислений    
 tmp1r=real(finish_time1-start_time1)
 write(*,'(A16,TR1,I2.2,A1,I2.2,A1,F4.1)')"Time",int1(tmp1r/3600.0),":",int1(mod(tmp1r,3600.0)/60.0),":",mod(tmp1r,60.0)
 pause  
end
!=====================================================
function timer()
!=====================================================
! Определение процессорного времени timer в  
! секундах
!=====================================================
 real(8):: timer
 integer(4):: ival(8)
 call date_and_time(values=ival)
 timer=dble(ival(8))*0.001_8+dble(ival(7))+dble(ival(6))*60.0_8+dble(ival(5))*3600.0_8
endfunction timer
!=====================================================
 
Выдает: Time 00:00:0.0 Как измерить время на выполн. операции "+"?
Кстати, как Вы вставляете здесь "код"?

Всего записей: 80 | Зарегистр. 16-10-2008 | Отправлено: 08:53 13-11-2008
AZA_N

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
vaulin, извините, если не совсем в тему. Но зачем брать для измерения времени вычисления максимально возможное значение n? И если у Вас такой мощный компьютер, что Вам удалось дождаться окончания проверки, то почему бы не работать из оболочки, а не из командной строки?  
 
Замените write(*,'(A16,TR1,I2.2,A1,I2.2,A1,F4.1)') на write(*,'(A16,TR1,I,A1,I,A1,G)') – будет не так красиво, но зато все будет выведено верно и не получите *** на выходе. А еще лучше заменить (или добавить) вывод в файл, чтобы не потерять результаты после пары часов проверки.
 
Код оформляется с помощью тега code. Почитайте коды форума и FAQ по RU-Board, там много интересного. А если не понятно, как кто-то что-либо делает,  но нажмите на «редактировать» в его сообщении и все увидите.
 
akaGM под
Цитата:
Код:fortran_compiler.exe file.f file.for file.f90 file1.f file1.for file1.f90 file2.obj file2.lib /out:myexe.exe
имел ввиду, как мне кажется, следующее (давно командной строкой не пользуюсь, подзабыла):  

Код:
 df.exe все_необходимые_для_работы_программы_файлы_for_и_библиотеки_(через_пробел) /out:файл.exe    

 

Всего записей: 853 | Зарегистр. 10-11-2007 | Отправлено: 10:30 13-11-2008 | Исправлено: AZA_N, 10:39 13-11-2008
Andrew10

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
vaulin

Цитата:
Ничего не понял А теперь для чайников, что такое fortran_compiler.exe? где это взять; df что ли здесь не нужен? file2.obj - откуда это взять? предварительная компиляция? Может лучше взять пример попроще? Как, к примеру, обработать совместно файл f1.for, где содержатся подпрограммы и модули, с файлом f2.for, в кот. содерж. главная программа (откуда вызываются эти самые подпрограммы и модули)?  

 
Есть старая мудрая шутка: если все способы наладить новый холодильник (пылесос, телевизор и т.д.) не приводят к успеху, попробуйте почитать инструкцию
 
Почитайте документацию к CVF (файл dfmain.chm): Programmer's Guide -> Using compiler and linker from the Command Line.

Всего записей: 780 | Зарегистр. 26-02-2005 | Отправлено: 10:33 13-11-2008
vaulin

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
AZA_N

Цитата:
df.exe все_необходимые_для_работы_программы_файлы_for_и_библиотеки_(через_пробел) /out:файл.exe  

Спасибо большое! я понял, что для меня это будет неудобно. Проще, действительно, создать проект.
Andrew10

Цитата:
Есть старая мудрая шутка: если все способы наладить новый холодильник (пылесос, телевизор и т.д.) не приводят к успеху, попробуйте почитать инструкцию  

на то и нужны друзья, чтобы помогать в трудную минуту ... а еще, видимо, лучше сказать так: на то и трудные минуты, чтобы появились друзья )
 
Добавлено:
AZA_N

Цитата:
Но зачем брать для измерения времени вычисления максимально возможное значение n? И если у Вас такой мощный компьютер, что Вам удалось дождаться окончания проверки, то почему бы не работать из оболочки, а не из командной строки?

... не понял, он у меня вообще в сек. считает!? в этом-то и проблема. Как я понимаю, операция сложения требует очень мало времени, так мало, что даже трудно зафиксировать. ПК у меня вообще древний, рассказать даже стыдно (в НИИ работаю, думаю, этим все сказано )

Цитата:
Замените write(*,'(A16,TR1,I2.2,A1,I2.2,A1,F4.1)') на write(*,'(A16,TR1,I,A1,I,A1,G)') – будет не так красиво, но зато все будет выведено верно и не получите *** на выходе

?? а он у меня и не выдает "***", он выдает всё красиво: 00:00: 0.0, эту подпрогр. из Бартеньева, по-моему, взял. И считает он ни пару часов, а доли сек. Будет считать несколько часов в том случае, если в цикл включить вывод на экран чего-нибудь, вот тогда да, сорее повесишься, чем дождешься
 
Добавлено:
а вообще, Andrew10, ты прав. Зачем я лезу со своими дурацкими вопросами, ведь всё это спрокойно можно найти в литературе, эх ... пока

Всего записей: 80 | Зарегистр. 16-10-2008 | Отправлено: 12:08 13-11-2008
Andrew10

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
vaulin

Цитата:
а вообще, Andrew10, ты прав. Зачем я лезу со своими дурацкими вопросами, ведь всё это спрокойно можно найти в литературе

 
На самом деле наиболее полезно сочетать оба способа. Прошу прощения, если ненароком обидел

Всего записей: 780 | Зарегистр. 26-02-2005 | Отправлено: 13:32 13-11-2008
AZA_N

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
vaulin, а может Ваши "0.0" - это все-же что-то типа "x.xxxxxxxxxxxxxxxxE-xx"?.  
 
А от командной строки на слабом компьютере отказываться нельзя, а лучше сочетать работу с ком. строкой и в IDE. Наберите df.exe / ? > hlp_df и посмотрите в файле hlp_df краткое описание всех опций. Пока не разберетесь во всех опциях, можно просто создать bat:  

Код:
 
call dfvars.bat
df.exe имя_файла.f90
 

в результате выполнения которого должен создаться имя_файла.exe (c опциями, которые у компилятора по умолчанию). И сделайте N не параметром, а переменной, вводящейся с экрана. Может я что и не так сделала, но у меня в Вашей программе даже для N=10 значения, отличные от нулевых.
 

Цитата:
ПК у меня вообще древний, рассказать даже стыдно

Чего же тут стыдного? Пусть начальству стыдно будет.  У меня на работе (в НИИ) на P133 и PIV-466 довольно сносно можно было работать в оболочке, когда требовалась отладка (правда, надо было малость поколдовать над системой и софтом).
 
 
 
 

Всего записей: 853 | Зарегистр. 10-11-2007 | Отправлено: 13:49 13-11-2008 | Исправлено: AZA_N, 13:59 13-11-2008
akaGM

Platinum Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
AZA_N -- компилятор с акагээмовского на человеческий...
 
-----
лучше уж так (f.bat):
Код:
 
@call dfvars.bat
df.exe %1 %2 %3 %4 %5 %6 %7 %8 %9

и вызывать с подставлением по мере необходимости нужных параметров:
 
f /с myfile.f90
 
f myfile.f90 mylib.lib
 
f foo.obj
 
например...
 
-----
 
vaulin
у тебя все константы были даблы, а в строке:
Цитата:
 
write(*,'(A16,TR1,I2.2,A1,I2.2,A1,F4.1)')"Time",int1(tmp1r/3600.0),":",int1(mod(tmp1r,3600.0)/60.0),":",mod(tmp1r,60.0)

ты это сделать забыл...
-----
 
да, это непринципиально...
 
 
кстати, у меня и c n=4 время ненулевое...

Всего записей: 24052 | Зарегистр. 06-12-2002 | Отправлено: 14:25 13-11-2008 | Исправлено: akaGM, 16:56 13-11-2008
Kukumber2121



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Здравствуйте. Подскажите, кто-нибудь пытался считать свои задачи на видеокартах? Какие впечатления? Высока ли сложность реализации данного действия? А то, я смотрю, это дело входит в моду-вон недавно nVidia мини суперкомпьютер представила на основе четырех обычных (в плане серийности) карт.

Всего записей: 207 | Зарегистр. 31-12-2005 | Отправлено: 12:24 21-11-2008
akaGM

Platinum Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Kukumber2121
а то! мы уже на мышах считаем -- тридцать в ряд == 8086...
 
а если серьёзно -- то на фига?
что ты хочешь/хотел бы считать так интенсивно на видюхах, да ещё, судя по всему, дома?
слава богу, игры какие-нибудь это дело запрягут или @home на cell'ах -- вполне достаточно...
 
вся инфа вроде здесь сидит, смотри...
http://www.nvidia.com/object/cuda_home.html

Всего записей: 24052 | Зарегистр. 06-12-2002 | Отправлено: 07:44 24-11-2008 | Исправлено: akaGM, 07:45 24-11-2008
FuzzyLogic



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Kukumber2121
Да, пробовал, имхо в меру сложно, но зависит от того кто вы, а также от задачи. Учёному физику который с трудом что-то делает на фортране будет трудновато, человеку с образованием в IT занимавшемуся системным программированием ранее вполне терпимо. В плане задач тоже не всё однозначно. Я пробовал делать на основе CUDA с картами nVidia, в зависимости от того сколько у вас потоков (зависит от железа карты) вы получаете соотв. кол-во параллельных "процессоров", т.е. для скажем 8800 это кажется 192. Но тут начинается веселуха, чтобы это работало быстро, надо ограничиваться хранением оперируемых данных в кэше данного потока, иначе все преимущества в скорости резко улетучиваются. А кэша этого есть ну порядка 10 килобайт или что-то около того (опять же зависит от карточки). Т.е. ещё до начала процесса программирования вам надо вашу программу разбить на параллельные потоки каждый из которых пользуется (в основном) очень ограниченным кол-вом памяти. Ну а потом начинаются танцы с бубном вокруг компиляторов и глюков в программном обеспечении CUDA (сыровато там пока ещё всё, имхо) и в результате я от этого всего отказался.

Всего записей: 1920 | Зарегистр. 27-07-2002 | Отправлено: 08:40 24-11-2008
akaGM

Platinum Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
FuzzyLogic
а что (и как кто?) ты считал таким образом?

Всего записей: 24052 | Зарегистр. 06-12-2002 | Отправлено: 10:55 24-11-2008
FuzzyLogic



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
akaGM
Считал течение воды по морям и океанам (упрощенные ур-я Навье-Стокса). Как кто точно не скажу, но скорее пожалуй второе, так как некоторый опыт в программировании у меня есть, да и как железо работает я немного понимаю. Вообще вполне реально это всё делать, но уж очень трудоёмко. Я подожду пока Intel сделает свой CPU+GPU гибрид и прикрутит к нему свои-же компиляторы, тогда думаю буду пробовать ещё раз.

Всего записей: 1920 | Зарегистр. 27-07-2002 | Отправлено: 13:14 24-11-2008 | Исправлено: FuzzyLogic, 13:15 24-11-2008
Открыть новую тему     Написать ответ в эту тему

Страницы

Компьютерный форум Ru.Board » Компьютеры » Прикладное программирование » Вопросы программирования на FORTRAN (ФОРТРАН)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru